Entwickler-Ecke

Datenbanken - Links auf HTML-Tabelle extrahieren


Rufus2k - Fr 16.06.06 23:31
Titel: Links auf HTML-Tabelle extrahieren
Hallo,

ich suche verzweifelt nach einer Möglichkeit die Hyperlinks aus der ersten Spalte von folgender Seite zu extrahieren, also in einem String auszugeben:

http://www.oddsexplorer.com/?cat=surebets

Über Eure Hilfe wäre ich sehr dankbar

Gruß Rufus


matze.de - Sa 17.06.06 10:22

Am besten nimmst du dafür Reguläre Ausdrücke, bastelst dir dafür ein Suchmuster und jagst das über den Seitenquelltext.

mfg matze


nullplan001 - Sa 17.06.06 10:29

Oder du baust dir einen Parser: Erstmal die Seite in eine temporäre Datei saugen. Dann die Seite auslesen, bis du zu "<b>Event</b>" kommst, dann zu "</tr>" springen, nach "<a" suchen, bei Treffer nach "href=" suchen und alles was zwischen dem darauffolgenden " und dem nächsten liegt in einen String kopieren. Dann wieder zu "</tr>" springen, nach "<a" suchen... bis eof(tempdatei). So, das ganze jetzt noch in Quelltextform bringen. Viel Spaß.
Tschö,
nullplan


MrSaint - Sa 17.06.06 11:08

Oder du machst dir den Parser des IE zu nutze ;) Zuerst alles in einen TWebBrowser laden. Dann hast du per

Delphi-Quelltext
1:
WebBrowser1.Document as IHTMLDocument2                    

Zugriff auf ein IHTMLDocument2, mit welchem du so ziemlich alles über den HTML Code rausbekommen kannst ;) Der wurde dann praktisch in einem InternetExplorer geparst... Weiterführende Links:
http://msdn.microsoft.com/library/default.asp?url=/workshop/browser/mshtml/mshtml_editing_node_entry.asp
http://msdn.microsoft.com/library/default.asp?url=/workshop/browser/mshtml/reference/ifaces/interface.asp


MrSaint