Also erkennen kannst/musst du sie anhand des e-mail Headers. "
Content-Type: text/plain;charset=iso-8859-1". Da sollte dann utf-8 drinne stehen.
Wenn ich das ganze Unicode Zeugs so richtig verstanden habe sollte man bei Dateien immer von Single Byte ausgehen außer man findet
ein Steuerzeichen. 2, 3 oder 4 Bytes. Die geben dann die zukünftige Gesinnung an. Editoren wie Notepad halten sich dran. Ich weiß nicht ob in Mails auch solche Sonderzeichen stecken können.
Evtl hilft dir das faq
Unicode and the Web noch etwas weiter.
Zum Dekodieren von utf-8 gibt es verschiedene Quellen. Die Bibliothek von Mike Lischke beinhält das oder zum besseren Verständniss hat mir persönlich
der utf-8 Artikel auf wikipedia geholfen. Die Quellen wandeln aber utf-8 in utf-16 um. Also 2 byte pro Zeichen. Du müsstest da aber wohl hergehen und die utf-8 in Texte einer Codepage (Ansisatz) umwandeln.
Nur die Menschheit ist arrogant genug, um zu glauben sie sei die einzige intelligente Lebensform im All. Wo nicht mal das nachhaltig bewiesen wurde.