Entwickler-Ecke

IO, XML und Registry - HtmlReader


DrHoas - Mi 16.06.10 09:03
Titel: HtmlReader
Hallo,

ich hab bisher aus einem Programm xml-Dateien exportiert und mit C# dann Daten mit dem XmlReader ausgelesen. Dummerweise sind in der xml-Datei nicht alle Daten enthalten, die ich brauche. Exportiere ich als html, ist alles drin. Gibt es auch einen HtmlReader?

Dank und Gruß

Philipp


danielf - Mi 16.06.10 10:09

Hallo,

wenn du aus dem html ein XHTML machst, kannst du es wie ein Xml Dokument verwenden. Dafür gibt es verschiedene Tools:

http://www.example-code.com/csharp/web_page_analyzer.asp

Mit den Stichwörtern Html to Xhtml solltest du auch viel bei google finden.

Hoffe das Hilft.

Gruß


DrHoas - Mi 16.06.10 11:28

So, hab grad mal zwei HTML2XHTML-Tools ausprobiert und beide haben nicht funktioniert.

Da ich nicht viel aus der Datei auslesen muss, probier ich's mal anders:
Kann man eine komplette Datei als String einlesen, in diesem String dann nach einer Zeichenkette suchen und das darauffolgende Wort speichern?

Danke nochmal

Philipp


danielf - Mi 16.06.10 11:45

Ist die HTML-Datei so inkonform?

Du kannst mit den String Methoden oder Regulären Ausdrücken Zeichenketten verarbeiten bzw. durchsuchen. Ich würde Reguläre Express (in .NET in der Klasse Regex Implementiert) nehmen.

Den String bekommst du einfach durch einen WebClient und DownloadString.