Autor Beitrag
netspy
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic star
Beiträge: 75



BeitragVerfasst: Mo 12.03.07 01:46 
Hallo Thjostalf,

hätte die Unicode-Unterstützung gern getestet aber leider werden auch mit der 1.0.7.310 nur Hieroglyphen bei japanischen oder chinesischen Texten (UTF-8 kodiert) angezeigt.

Wie funktioniert die Unicode-Unterstützung überhaupt bei dir? Ich kann nirgendwo einen Option finden, in der ich die Zeichensatzkodierung der Datei beim Laden oder Speichern angeben kann. Versucht das TxtPad automatisch zu erkennen? Das ist sehr schwierig und häufig fehlerhaft. Auch zeigt mir TxtPad nach dem Laden nicht an, welche Kodierung verwendet wurde, sodass ich nicht sagen kann, ob die Datei falsch eingelesen wurde oder falsch angezeigt wird.

Zum Testen kannst du ja mal dieses Deutsch-Chinesische Wörterbuch runterladen und die .u8 Datei öffnen.

Mario

_________________
So Long, and Thanks for All the Fish.
Thjostalf Threadstarter
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starofftopic star
Beiträge: 21

Win2k, WinXP
D3 Prof, D4 Prof, Turbo Delphi Prof
BeitragVerfasst: Mo 12.03.07 21:51 
Titel: Datei mit Unicode-Zeichen
Hallo,

der praktische Nutzen der Unicode-Unterstützung von Notepad besteht für mich darin, daß ich nun die Dateien, die durch die Exportfunktion von Regedit erstellt wurden, ohne Probleme lesen kann. Das war quasi auch mein praktischer Test / neben der Übernahme von kyrillischen Zeichen aus der Zwischenablage und dem anschließenden Laden/Speichern derselben. An eine hin- und her-Konvertierung zwischen den Zeichensätzen habe ich ehrlich gesagt nicht gedacht.

TxtPad orientiert sich an Unicode (Low und Big Endian) und hält sich beim Laden und Speichern entsprechender Daten an den BOM. Mit UTF-8 kann ich momentan noch nicht verarbeiten - aber eben alles, was auch Windows Notepad als Unicode einliest - wenn's einen entsprechenden BOM gibt.

Nachdem ich mit Windows Notepad und expliziter UTF-8 Auswahl die von Dir genannten Beispieldateien eingelesen und die Dateien als Unicode gespeichert hatte, sah das Ergebnis meiner Meinung nach ok aus. Habe mal einen Screenshot davon gemacht...

Gruß, Marian
Einloggen, um Attachments anzusehen!
netspy
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic star
Beiträge: 75



BeitragVerfasst: Di 13.03.07 00:10 
Windows arbeitet intern mit UCS-2 (ähnlich wie UTF-16). Das wird jedoch in normalen Texten sehr selten verwendet und nur das zu unterstützen bringt leider nicht viel. Wichtig wäre auf jeden Fall die Unterstützung von UTF-8, da dies die am häufigsten genutzt Unicode-Kodierung ist.

Mario

_________________
So Long, and Thanks for All the Fish.