Rolf B: umstellung mariadb, nun codierungsproblem

Beitrag lesen

Hallo Gunnar,

Zeichensatz? Eine Collation ist doch mehr als das.

Ja. Stimmt. Der Zeichensatz ist das vor dem ersten Unterstrich.

Werden im Schwedischen nicht Umlaute nach Z einsortiert? Da würde ich dann nicht von „passt halbwegs“ sprechen, sondern von: passt gar nicht.

Ups. Danke. Passt gar nicht.

Solange Du in Perl nicht versuchst, einen solchen String zeichenweise (statt byteweise) zu verarbeiten, fällt das gar nicht auf.

Bist du da mit der Verneinung und Zeichen und Bytes durcheinander gekommen?

Ja. Hm. Scheißencodings. Ich hatte den Text mehrfach umgeändert. Gemeint hatte ich: Wenn man die Bytefolge eines latin1-codierten Strings als UTF-8 deutet und dann zeichenweise verarbeitet, geht's schief. Weil nur einzelne Bytes mit Wert > 127 da sind, und keine UTF-8 Sequenzen.

Oje. Jetzt hab ich am Ende vermutlich mehr Durcheinander gemacht statt sortiert.

Ich weiß nicht, wie weit Du Dich auf 100% UTF-8 einlassen kannst.

Ich weiß, dass man sich 100%ig auf UTF-8 einlassen sollte.

Weiß ich ja auch. Aber wenn man eine Tonne Latin1-Legacy hat, mag das anders aussehen.

Rolf

--
sumpsi - posui - obstruxi