Tom: Zeichenkodierung einer Datei auslesen

Beitrag lesen

Hello,

Meine zwischenzeitliche Idee, einfach immer UTF-8-Output zz liefern, egal wie der Input kodiert war, ist auch nicht wirklich brauchbar, da Sonderzeichen ja nicht automatisch korrekt kodiert werden und auf Scherereien mit str_replace habe ich wenig Lust.

Und utf-8² solltest Du besser auch nicht bauen. Das war ja, worau Sven R. mich aufmerksam machte, als er empfahl, die Inhalte strikt von der Logic zu trennen. dann kann man die Inhalte _immer_ in utf-8 vorhalten und hat immer definierten Input.

Woher beziehst Du denn Deinen Input?
Kannst Du nicht den User bitten, er möge den Code-Selektor bedienen?
Der Mensch sieht dann ja noch am besten, wann die Dekodierung passt.

Es muss aber eine Lösung geben, denn z.B. Textpad erkennt utf-8 automatisch und sicher.

Harzliche Grüße vom Berg
esst mehr http://www.harte-harzer.de

Tom

--
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau