Autor Beitrag
Rufus2k
Hält's aus hier
Beiträge: 2



BeitragVerfasst: Fr 16.06.06 23:31 
Hallo,

ich suche verzweifelt nach einer Möglichkeit die Hyperlinks aus der ersten Spalte von folgender Seite zu extrahieren, also in einem String auszugeben:

www.oddsexplorer.com/?cat=surebets

Über Eure Hilfe wäre ich sehr dankbar

Gruß Rufus
matze.de
ontopic starontopic starontopic starontopic starontopic starontopic starofftopic starofftopic star
Beiträge: 576

Win95, Win98 SE, WinXp Prof SP2
D7P, D8P, FPC2.0
BeitragVerfasst: Sa 17.06.06 10:22 
Am besten nimmst du dafür Reguläre Ausdrücke, bastelst dir dafür ein Suchmuster und jagst das über den Seitenquelltext.

mfg matze

_________________
si tacuisses, philosophus mansisses.
nullplan001
ontopic starontopic starontopic starontopic starontopic starhalf ontopic starofftopic starofftopic star
Beiträge: 212

Win 2000 Professional, Debian Linux 4.0 (Etch,Stable)
Pascal (FreePascal 2.0.2, TurboPascal 7.0), C(++) (G++/GCC 3.4.2 + MinGW), Java (JDK 1.5.0_07), PHP (PHP 5.1.4)
BeitragVerfasst: Sa 17.06.06 10:29 
Oder du baust dir einen Parser: Erstmal die Seite in eine temporäre Datei saugen. Dann die Seite auslesen, bis du zu "<b>Event</b>" kommst, dann zu "</tr>" springen, nach "<a" suchen, bei Treffer nach "href=" suchen und alles was zwischen dem darauffolgenden " und dem nächsten liegt in einen String kopieren. Dann wieder zu "</tr>" springen, nach "<a" suchen... bis eof(tempdatei). So, das ganze jetzt noch in Quelltextform bringen. Viel Spaß.
Tschö,
nullplan

_________________
Ich fahr' nicht selber, weil ich festgestellt habe: ich fahre zu emotional. Bin 180 gefahren wo 30 erlaubt war... -- Jürgen von der Lippe
MrSaint
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 1033
Erhaltene Danke: 1

WinXP Pro SP2
Delphi 6 Prof.
BeitragVerfasst: Sa 17.06.06 11:08 
Oder du machst dir den Parser des IE zu nutze ;) Zuerst alles in einen TWebBrowser laden. Dann hast du per
ausblenden Delphi-Quelltext
1:
WebBrowser1.Document as IHTMLDocument2					

Zugriff auf ein IHTMLDocument2, mit welchem du so ziemlich alles über den HTML Code rausbekommen kannst ;) Der wurde dann praktisch in einem InternetExplorer geparst... Weiterführende Links:
msdn.microsoft.com/l...iting_node_entry.asp
msdn.microsoft.com/l...ifaces/interface.asp


MrSaint

_________________
"people knew how to write small, efficient programs [...], a skill that has subsequently been lost"
Andrew S. Tanenbaum - Modern Operating Systems