Entwickler-Ecke

Internet / Netzwerk - HTML Quelltext auslesen


kunibert - So 06.09.09 20:22
Titel: HTML Quelltext auslesen
Hallo!
ich habe mal eine Frage.
Ist es möglich in meinem Standard Browser (Firefox, wenn da nicht möglich, dann IE) den Quelltext einer Seite auszulesen?
Per direkter Anfrage durch ein Delphi Programm bekomme ich eine invalid session... (ja es ist ein Spiel, bei dem ich aus dem Protokoll meiner Stadt herausfiltern will für jedes Mitglied was es aus dem Lager genommen hat und was es wieder eingelagert hat)
das ganze manuell zu machen benötigt viel zu viel Zeit, die ich im Moment nicht habe... zumindest nicht unter der Woche.

Ich habe mir das ganze Programm so vorgestellt, das ich die Seite des Protokolls in das Programm ausgebe, und dann das Programm aus den 100 HTML Seiten dann den Quellcode herauszieht und für mich aufbereitet...
Alles außer der Quelltextabfrage ist kein Problem. Der Quelltext jedoch stellt mich vor ein scheinbar unlösliches Problem.

Theoretisch bräuchte entweder das Programm den aktuellen Cookie des Browsers oder aber es müsste einen Weg geben mit dem das Programm mit dem Browser kommunizieren kann

Kann mir da jemand weiterhelfen?

Gruß Kuni


Moderiert von user profile iconNarses: Topic aus Delphi Language (Object-Pascal) / CLX verschoben am Mo 07.09.2009 um 00:10


platzwart - So 06.09.09 20:24

Das ganze widerspricht doch sicherlich den AGB des Spiels?!?


Xentar - So 06.09.09 20:26

Könnte mir vorstellen, dass sowas nicht erlaubt ist..

Crosspost...
http://forum.delphi-treff.de/showthread.php?t=27409


kunibert - So 06.09.09 20:33

der selbe Post von mir in 2 Foren.. ist das etwa verboten?
die user des einen forums wissen vielleicht auf der einen Ecke mehr die des anderens auf der anderen... schlimm wenn man in 2n postet?
es ist doch nicht so dass die beiden Foren im direkten Konkurrenzkampf miteinander stehen

achja.. und zur frage mit den nubs.. wenn ich den Browser nutze und den quellcode so bekomme ist es laut den nubs nicht verboten.. ich darf nur mit nichts anderem als einem browser mit dem spiel kommunizieren... (und ein twebbrowser bleibt trotzdem ein browser)


jaenicke - So 06.09.09 20:40

user profile iconkunibert hat folgendes geschrieben Zum zitierten Posting springen:
der selbe Post von mir in 2 Foren.. ist das etwa verboten?
Nein, aber du solltest die Crossposts angeben, damit man die Gelegenheit hat im jeweils anderen Forum zu schauen, ob es dort schon eine Lösung gibt. Denn sonst macht man sich vielleicht die Mühe und schreibt etwas dazu und im anderen Forum steht schon das selbe da...

Zum Thema:
Es sollte, wenn es nur um die Cookies geht, genügen zusätzlich zu TIdHttp auch einen TIdCookieManager zu verwenden. Anders sieht es aus, wenn auch noch Skripte verwendet werden, das ginge mit Indy nicht.

Mehr kann man aber allgemein nicht sagen ohne zu wissen um welche Seite es geht, da müsstest du schon schauen was da alles passiert. :nixweiss:
Da gibt es ja Tools wie FireBug, HttpFox, Web Developer Toolbar, WireShark, usw., die ziemlich genau zeigen was da passiert auf der Seite.


kunibert - So 06.09.09 20:46

ok.. wusste ich nicht ;) danke für den Hinweis


TIdCookieManager kenne ich nicht, ich werde mich aber mal ein bisschen damit befassen ;) danke schonmal für die Hilfe. Vielleict bin ich nachher schon schlauer