ChrisB: mb_detect_encoding?

Beitrag lesen

Hi,

Ich wollte nun mit "mb_detect_encoding" herausfinden wie die Kodierung des Strings ist.

Das läßt sich nicht immer zweifelsfrei bestimmen, sondern oftmals nur an Hand von Indizien mehr oder weniger gut „erraten“.

Wenn String = "gelb"
der Test gelb hat charset UTF-8

Bei "grün"
der Test gr�n hat charset ISO-8859-1

Ich hatte das gerade anders herum erwartet.

Der ASCII-Zeichenbereich wird in UTF-8 ganz genauso kodiert wie in ASCII.

g, e, l, b sind alles Zeichen, die ASCII enthält. Deshalb ist das auch gleichzeitig gültiges UTF-8. Diesen String „als UTF-8“ weiter zu be- und verarbeiten ist also problemlos möglich.

In deinem „grün“ ist aber das ü aber als ISO-8859-1 kodiert, das sich an der Stelle nicht mit UTF-8 deckt.

MfG ChrisB

--
Autocomplete has spoiled me to a point where it happens every so often that I encounter a CAPTCHA, and I just type in the first character … and then wait for the rest of the code to be automatically suggested :/