*Markus: (LINUX / BASH / MYSQL) Verständnisproblem bei Zeichenkodierung

Beitrag lesen

Hallo,

Wenn du auf ISO-8859-1 gestellt die UTF-8-Sequenzen zu sehen glaubst, und auf UTF-8 gestellt "Zerstörtes" (wie sieht das konkret aus?), dann sieht mir das nicht nach gültigen UTF-8-Sequenzen aus. Zumal nach deiner Beschreibung nach einem UTF-8-Zeichen noch nachfolgede Zeichen verschwinden, was darauf schließen lässt, dass die UTF-8-Sequenz ungültig ist und nachfolgende Zeichen von UTF-8-Dekodierer gefressen werden, weil der noch mehr Bytes zur Sequenz zugehörig erwartet.

Nein. Die Kodierung sieht überall richtig aus. Sowohl die JSP-Seite im Browser, als auch die Ausgabe mit mysql in der Konsole, sowie auch die Ausgabe mit dem MySql Query Browser.
Schalte ich im Browser auf iso8859-1, wird diese natürlich falsch angezeigt.
Schalte ich wieder auf UTF-8, ist alles wieder in Ordnung.

Ich muss nur in Java serverseitig folgendes schreiben:

  
  
   request.setCharacterEncoding("UTF-8");  
   response.setCharacterEncoding("UTF-8");  
  

Liegt es einfach nur daran, dass in POST einfach nichts UTF-8-kodiert wird, und ich es deswegen immer so machen muss? Allerdings muss man das natürlich irgendwo umstellen können.

Markus

--