heinetz: Die gute alte Zeichenkodierung

Beitrag lesen

… ich habe also noch ein wenig weiter versucht zu interpretieren. Im Dump steht bspw. folgendes Wort:

Spritzfüller

Korrigieren kann ich es auf folgende Weise:

Mein Editor bietet mir zum Thema Zeichenkodierung zwei (genau genommen 3) Möglichkeiten. Die erste ist, dass er mir anzeigt mit welcher Kodierung ein Dokument abgespeichert ist. Die zweite, dass ich das ändern und bspw. ein iso-8859 in ein utf-8 konvertieren kann, die dritte ist, statt zu konvertieren, erstmal nur das iso-8859 als utf-8 zu interpretieren.

Das ist sehr aufschlussreich, denn interpretiere ich das Wort als utf-8 wird es korrekt dargestellt.

In meinem Dokument steht, wenn ich das richtig verstehe ein utf-8-kodierter String, der nicht als utf-8 interpretiert wird.

Im Dump steht ausserdem DEFAULT CHARSET=latin1, im Browser aber utf-8. Ohne etwas über den Transfer-Typ herausgefunden zu haben, würde ich das so interpretieren, dass bei der Anwendung lediglich das Frontend irgendwann mal auf utf-8 umgestellt worden ist und utf-8-kodierte Daten irgendwie in der latin1-DB speichert.

Ganz pervers ist aber folgender Text, den ich in dem Dump und im Frontend gefunden habe:

für kleine Reparatur- und Durchschliffstellen. Überschweißbar!

Hier fehlt mir die Phantasie ;) Der Text steht in ein und dem selben Formular- bzw. DB-Feld. Wie kriegt man das hin?

gruss,
heinetz