Entwickler-Ecke
Basistechnologien - Mit regulären Ausdrücken eine Tebelle in HTML auslesen
mnevis - Do 14.02.08 18:14
Titel: Mit regulären Ausdrücken eine Tebelle in HTML auslesen
Hallo zusammen,
ich muss für mein kleines Prog hier eine Tabelle aus einem HTML Quelltext auslesen
Der quelltext ist wie wohl fast jedem bekannt folgendermassen aufgebaut:
<HTML>
...
<BODY>
...
<table>
<tr>
...
</tr>
</table>
...
Was ich jetzt wollte ist mit
muster = "<table">"+@"[.|\n]*"+"</table>";
die Tabelle an sich aus dem Quelltext heraus zu extrahieren. dies klappt aber leider mit deiesem muster nicht.
Könnte mir vielleicht jemand ein Tipp geben wie ich das Muster so aufbaue, dass ich wirklich alles(an zeichen) in der Tabelle drine haben kann, dann aber die Tabele als solche finde. Ich wollte auch den fall mitberücksichtigen, dass der quelltext in html als einzeiler da steht. bzw ich könnte es ja gleich so haben in dem ich alle \n direkt herausfische...
bin für jeden tip dankbar!
gruß,
alex
Kha - Do 14.02.08 19:05
Das kann nicht funktionieren. Erstens matcht '.' in einer Gruppe einfach nur '.', zweitens benutzt man in einer Gruppe keinen |-Operator. Ich würde einfach vorschlagen:
zusammen mit der Multiline-Option. Verschachtelte Tabellen sind damit natürlich nicht möglich.
Entwickler-Ecke.de based on phpBB
Copyright 2002 - 2011 by Tino Teuber, Copyright 2011 - 2025 by Christian Stelzmann Alle Rechte vorbehalten.
Alle Beiträge stammen von dritten Personen und dürfen geltendes Recht nicht verletzen.
Entwickler-Ecke und die zugehörigen Webseiten distanzieren sich ausdrücklich von Fremdinhalten jeglicher Art!