Entwickler-Ecke

Internet / Netzwerk - HTML Datei sinnvoll zerlegen...


Sithlord - Fr 19.03.10 02:21
Titel: HTML Datei sinnvoll zerlegen...
Hallo Community,

ich habe eine Memo mit einem Quelltext darin. Mich interessiert davon aber nur eine Tabelle und die einzelnen Einträge in dieser.

Wie kann ich alles bis auf diese eine Tabelle aus dem Quellcode entfernen und dann jeden einzelnen Eintrag auslesen? Bzw. es würde schon sehr helfen wenn ich den überflüssigen Kram irgendwie loswerden könnte...


Quelltext
1:
2:
3:
<table class="forenUebersicht" cellpadding="0" cellspacing="0" border="0" width="100%">

</table>


Mfg

Moderiert von user profile iconNarses: Überflüssige Zeilenumbrüche/Leerzeilen entfernt.


Martok - Fr 19.03.10 02:31

Wow.
Ist dein Profil echt, ich kenn jemanden, der hat mich vor ein paar Tagen exakt das gleiche gefragt. Allerdings nicht mit Foren, sondern Werkzeugnummern ;)


Anyway: das Einfachste ist ein gewusel aus Pos, Copy, PosEx und vielleicht noch Delete, mit dem du den ungewollten Teil löschen bzw. die gewollten Felder rauskopieren kannst.

Alternativ wäre das HTML zu parsen, aber das ist eigentlich immer unnötig.


Sithlord - Fr 19.03.10 09:06

Oh, das konnte ich ja schlecht wissen ^^,

ich werde mich mal mit Pos, Copy, PosEx und Delete herumschlagen, vielleicht schaffe ich es ja ^^. Nur wegen dem Rainer Neugier, wie könnte man denn das HTML in Delphi parsen?


Narses - Fr 19.03.10 11:52

Moin!

user profile iconSithlord hat folgendes geschrieben Zum zitierten Posting springen:
wie könnte man denn das HTML in Delphi parsen?
Wenn es dich nicht stört, dafür den IE zu "missbrauchen", dann schau mal hier [http://www.delphi-forum.de/viewtopic.php?t=79678&start=0&postorder=asc&highlight=oleobject+document+tags+table]. :idea: :les: :think:

cu
Narses


elundril - Fr 19.03.10 12:56

Und ohne den Internet Explorer zu missbrauchen könnte man doch einen Endlichen Automaten verwenden, oder? Mehr [http://de.wikipedia.org/wiki/Parser] dazu auf Wikipedia.

lg elundril


Sithlord - Fr 19.03.10 23:21

Möchte nun den Teilstring

Quelltext
1:
<table class="forenUebersicht" cellpadding="0" cellspacing="0" border="0" width="100%">                    

suchen lassen.
Wenn ich die Ausgabe der Memo in ein Texteditor eingebe und es dann suchen lasse, geht
alles ohne probleme, so allerdings nicht:

Delphi-Quelltext
1:
2:
3:
4:
5:
6:
7:
8:
var
vor:integer;
S:string;
begin
S:=http.get('http://www.pcfreunde.de/forum/themenabfrage/?type=accountTopics&page=1&accountId=50202&filter=1');
vor:=pos('"forenUebersicht"',memo1.Lines.Text);
delete(S,0,vor);
memo1.Lines.Text:=S;

Weiß jemand, warum?
Hängt das mit den " zusammen?


elundril - Fr 19.03.10 23:23

überleg mal. Du ladest dir das HTML-Dokument in den String S. Suchen nach einem Schlagwort in dem HTML-File tust du aber in Memo1.Lines.Text. Fällt dir was auf? ;)

lg elundril


Sithlord - Fr 18.06.10 00:29

So nun komme ich auch noch mal zum antworten ^^. Jo ist mir dann auch, selten Dämlich das ganze ^^ Danke es geht nun so wie es soll, tolles Forum!