Der Martin: Charset - Das unbekannte Mysterium

Beitrag lesen

Hi,

Deshalb habe ich folgende Angabe im Header:
<meta http-equiv="Content-Type" content="text/html; charset=iso-8859-1" />

diese Zeile ist wahrscheinlich bedeutungslos. Wichtig ist: Sendet der Server im HTTP-Header die gleiche Codierung? Denn nur wenn er keine Angabe dazu macht, zählt ersatzweise die Information aus dem entsprechenden meta-Element.

lasse die ganzen Texte mit Server.HTMLEncode durchfiltern, damit Sonderzeichen und Umlaute in HTML Entities umgewandelt werden.

Warum? Hast du in einen Texten Zeichen, die in ISO-8859-1 nicht darstellbar sind? Wenn nicht, dann gib den Text doch einfach im Klartext aus und lass die Umwandlung in HTML-Entities sein.

Diese Funktion wandelt ein ü zum Beispiel aber nicht in &uuml; sondern in &#252; um.

Macht nichts, das ist das Gleiche.

Kann ich den Charset mit dieser Umwandlung auf iso-8859-1 belassen oder sollte ich auf utf-8 wechseln?

Nach deiner bisherigen Beschreibung kannst du entweder alles so lassen wie es ist, oder sogar auf dein HTMLEncode verzichten. Wenn du allerdings ganz sicher gehen willst, stell alles auf UTF-8 um - und dann kannst du auch endgültig auf irgendwelche Umcodierungen verzichten. Das mag im Moment etwas Aufwand sein, aber dann hast du kein Problem, wenn in einem halben Jahr jemand kommt und meint, er bräuchte nun doch noch eine griechische und eine türkische Fassung (ja, auch die türkische Sprache hat ein paar Zeichen, die mit ISO-8859-1 nicht abgedeckt sind).

So long,
 Martin

--
Zwischen Leber und Milz
passt immer noch'n Pils.