Der Martin: mb_detect_encoding?

Beitrag lesen

Hi,

ein PHP script liest eine CSV Datei ein die in Ascii ist und auch Umlaute enthalten kann.

das ist ein Widerspruch; ASCII enthält keine Umlaute.

Umlaute in der CSV werden daher so angezeigt:
�berregional

Das scheint dann wohl eher irgendeine 1-Byte-ISO-Codierung zu sein, etwa ISO-8859-x, vielleicht auch Windows-1252 oder sowas.

Ich wollte nun mit "mb_detect_encoding" herausfinden wie die Kodierung des Strings ist.

Das ist nicht wirklich zuverlässig möglich.

Wenn String = "gelb"
der Test gelb hat charset UTF-8

Dieser Beispieltext enthält nur ASCII-Zeichen. ASCII ist aber sowohl eine Untermenge von UTF-8 als auch ISO-8859-1, also wären alle drei Angaben richtig, weil nicht unterscheidbar.

Bei "grün"
der Test gr�n hat charset ISO-8859-1

Basierend auf Mutmaßung, ja.

Ich hatte das gerade anders herum erwartet.

Warum?

Ciao,
 Martin

--
Du kannst dem Leben nicht mehr Tage geben.
Aber dem Tag mehr Leben.
Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(