Autor Beitrag
Gambit
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starontopic star
Beiträge: 36



BeitragVerfasst: Sa 22.05.04 18:17 
Hallo,
ich parse Informationen aus zwei verschiedenen Internetseiten und möchte diese in einer Datenbank ablegen.
Nun ist die eine in UTF-8 codiert und die andere in Westeuropäisch(ISO)

Die Informationen der UTF-8 codierten Seite wandele ich um mit

ausblenden Delphi-Quelltext
1:
aText:= UTF8ToAnsi(idHTTP.get(URL));					


Damit werden die Texte in der Datenbank "richtig" abgelegt.
Bei der westeuropäisch(ISO) codierten habe ich einige Zeichen(z.B "...") falsch dargestellt bekommen, nämlich als Pipe Zeichen.

Gibt es irgendeine Funktion, mit der ich die Infos aus der westeuropäisch(ISO) codierten Seite auch "richtig" in meiner Datenbank ablegen kann?

Gruß

Gambit
Pierre
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic star
Beiträge: 138

Win 98se und XP prof
D5Pers und D7Prof
BeitragVerfasst: Mo 24.05.04 09:38 
Hallo,
ich hoffe, ich habe Dich richtig verstanden:

Du bekommst ISO zeichen in ASCII und brauchst Sie in ANSI!
Die Umlaute und Sonderzeichen fehlen, richtig?

Dann hilft Dir dies weiter:
ausblenden Quelltext
1:
if ASCIIzuANSI then OEMtoChar(PChar(Kopfzeile),PChar(Kopfzeile));  //ASCII to ANSI Konverter					


mit
ASCIIzuANSI:boolean;
Kopfzeile:string;

Ich hoffe, es hilft.
Gruß Pierre
Gambit Threadstarter
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starontopic star
Beiträge: 36



BeitragVerfasst: Mo 24.05.04 18:51 
Hmm... also Umlaute bekomme ich richtig. Das Pipe-Zeichen habe ich meist beim verlängertem Bindestrich oder bei 3 Punkten(Dort manchmal aber auch nicht)...

Gruß

Gambit
Pierre
ontopic starontopic starontopic starontopic starontopic starontopic starontopic starhalf ontopic star
Beiträge: 138

Win 98se und XP prof
D5Pers und D7Prof
BeitragVerfasst: Mo 24.05.04 20:08 
Hallo,
dann weiß ich es auch nicht. Eine Vermutung habe ich noch, dass die Codepages sein könnten. Dies hatte ich mal bei einem Barcode-Zeichensatz, dort waren einzelne Zeichen einfach falsch. Aber ich denke, dies hilfe Dir auch nicht weiter.
Gruß Pierre