Entwickler-Ecke
IO, XML und Registry - HtmlReader
DrHoas - Mi 16.06.10 09:03
Titel: HtmlReader
Hallo,
ich hab bisher aus einem Programm xml-Dateien exportiert und mit C# dann Daten mit dem XmlReader ausgelesen. Dummerweise sind in der xml-Datei nicht alle Daten enthalten, die ich brauche. Exportiere ich als html, ist alles drin. Gibt es auch einen HtmlReader?
Dank und Gruß
Philipp
danielf - Mi 16.06.10 10:09
Hallo,
wenn du aus dem html ein XHTML machst, kannst du es wie ein Xml Dokument verwenden. Dafür gibt es verschiedene Tools:
http://www.example-code.com/csharp/web_page_analyzer.asp
Mit den Stichwörtern Html to Xhtml solltest du auch viel bei google finden.
Hoffe das Hilft.
Gruß
DrHoas - Mi 16.06.10 11:28
So, hab grad mal zwei HTML2XHTML-Tools ausprobiert und beide haben nicht funktioniert.
Da ich nicht viel aus der Datei auslesen muss, probier ich's mal anders:
Kann man eine komplette Datei als String einlesen, in diesem String dann nach einer Zeichenkette suchen und das darauffolgende Wort speichern?
Danke nochmal
Philipp
danielf - Mi 16.06.10 11:45
Ist die HTML-Datei so inkonform?
Du kannst mit den String Methoden oder Regulären Ausdrücken Zeichenketten verarbeiten bzw. durchsuchen. Ich würde Reguläre Express (in .NET in der Klasse Regex Implementiert) nehmen.
Den String bekommst du einfach durch einen WebClient und DownloadString.
Entwickler-Ecke.de based on phpBB
Copyright 2002 - 2011 by Tino Teuber, Copyright 2011 - 2025 by Christian Stelzmann Alle Rechte vorbehalten.
Alle Beiträge stammen von dritten Personen und dürfen geltendes Recht nicht verletzen.
Entwickler-Ecke und die zugehörigen Webseiten distanzieren sich ausdrücklich von Fremdinhalten jeglicher Art!