TxtPad

netspy · Beiträge: 75

Hallo Thjostalf,

hätte die Unicode-Unterstützung gern getestet aber leider werden auch mit der 1.0.7.310 nur Hieroglyphen bei japanischen oder chinesischen Texten (UTF-8 kodiert) angezeigt.

Wie funktioniert die Unicode-Unterstützung überhaupt bei dir? Ich kann nirgendwo einen Option finden, in der ich die Zeichensatzkodierung der Datei beim Laden oder Speichern angeben kann. Versucht das TxtPad automatisch zu erkennen? Das ist sehr schwierig und häufig fehlerhaft. Auch zeigt mir TxtPad nach dem Laden nicht an, welche Kodierung verwendet wurde, sodass ich nicht sagen kann, ob die Datei falsch eingelesen wurde oder falsch angezeigt wird.

Zum Testen kannst du ja mal dieses Deutsch-Chinesische Wörterbuch runterladen und die .u8 Datei öffnen.

Mario

_________________
So Long, and Thanks for All the Fish.

Thjostalf · Verfasst: Mo 12.03.07 21:51 Titel: Datei mit Unicode-Zeichen

Hallo,

der praktische Nutzen der Unicode-Unterstützung von Notepad besteht für mich darin, daß ich nun die Dateien, die durch die Exportfunktion von Regedit erstellt wurden, ohne Probleme lesen kann. Das war quasi auch mein praktischer Test / neben der Übernahme von kyrillischen Zeichen aus der Zwischenablage und dem anschließenden Laden/Speichern derselben. An eine hin- und her-Konvertierung zwischen den Zeichensätzen habe ich ehrlich gesagt nicht gedacht.

TxtPad orientiert sich an Unicode (Low und Big Endian) und hält sich beim Laden und Speichern entsprechender Daten an den BOM. Mit UTF-8 kann ich momentan noch nicht verarbeiten - aber eben alles, was auch Windows Notepad als Unicode einliest - wenn's einen entsprechenden BOM gibt.

Nachdem ich mit Windows Notepad und expliziter UTF-8 Auswahl die von Dir genannten Beispieldateien eingelesen und die Dateien als Unicode gespeichert hatte, sah das Ergebnis meiner Meinung nach ok aus. Habe mal einen Screenshot davon gemacht...

Gruß, Marian

Einloggen, um Attachments anzusehen!

netspy · Beiträge: 75

Windows arbeitet intern mit UCS-2 (ähnlich wie UTF-16). Das wird jedoch in normalen Texten sehr selten verwendet und nur das zu unterstützen bringt leider nicht viel. Wichtig wäre auf jeden Fall die Unterstützung von UTF-8, da dies die am häufigsten genutzt Unicode-Kodierung ist.

Mario

_________________
So Long, and Thanks for All the Fish.

	Mitgliederliste
	Gruppen
	Das Team
	Richtlinien
	Synonyme