THWillert / _HTML

AutoIt UDF zum Extrahieren von Informationen aus HTML-Quelltext.

Geek Repo:Geek Repo

Github PK Tool:Github PK Tool

_HTML

Übersicht

AutoIt UDF zum Extrahieren von Informationen aus HTML-Quelltext, mit folgenden Funktionen:

Funktion Beschreibung
_HTML_ExtractURLVar Extrahiert eine URL-Variable aus einer URL.
_HTML_Get Liefert einen Wert, anhand Verschiedener Atrribute wie: class, id, title usw.
_HTML_GetAllLinks Gibt ein Array mit allen Links zurück.
_HTML_GetImageSrc Gibt die Quelle eines Bildes zurück.
_HTML_GetLink Gibt ein URL zurück, die den Parametern entspricht.
_HTML_GetSource Liefert den Quelltext einer Seite zurück. Scripte werden herausgefiltert.
_HTML_GetTable Liefert den Inhalt einer Tabelle als 2D-Array.
_HTML_GetText Gibt den reinen Text eines Bereiches zurück.
_HTML_GetURLVar Liefert eine URL-Variable aus einer URL.
_HTML_ImageSave Speicher das angebene Bild ab.
_HTML_Search Durchsucht den reinen Text einer Quelle.

Globale Suchparameter:

$_HTML_SEARCHMODE = 1
;(RegExp: 0 = Compare / 1 = Substring) (String: 2 = Compare / 3 = Substring)

Voraussetzungen

AutoIt

Installation

In das AutoIt Include Verzeichnis kopieren.

Diskussion / Vorschläge

...

ToDo

Die Reihenfolge entspricht keiner Priorität.

  • Funktion zum Auslesen von Tabellen verbessern.

Author

Thorsten Willert

Homepage

Lizenz

Das ganze steht unter der Apache 2.0 Lizenz. .

About

AutoIt UDF zum Extrahieren von Informationen aus HTML-Quelltext.

License:Apache License 2.0


Languages

Language:AutoIt 100.0%