Tom: utf-8 und PHP und HTTP-Header des Webserver

Beitrag lesen

Hello,

Da aber UTF-8 nur eine Untermenge von ASCII ist (also 7bit-Codierung), könnte da doch schon einmal ein Kriterium sein: eine Datei, die auch das achte Bit benutzt, kan  nicht UTF-8 sein. Oder habe ich da was falsch verstanden?

http://de.wikipedia.org/wiki/UTF-8

Sorry, das war falsch.
Es werden alle 8 Bit benutzt.
Das Bit 7 (80h  128d) wird eben zur Kennzeichnung der Umschaltung benutzt...

Der Ansatz von Candid https://forum.selfhtml.org/?t=112485&m=711482 ist da schon besser.

Schau Dir doch den UTF-8-Code mal im Hex-Editor an:

Ich kämpfe mich da gerade durch, wie man utf-8 und PHP unter einen Hut bringt.
Welchen Header sendet der Webserver für die Zeichenkodierung?
Reicht es, das charset im Header zu setzen?
Wer hat Vorrang? Der HTTP-Header oder das Meta-Äquivalent?

<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">

reicht es, alle Ausgaben, die PHP produziert mit utf8_encode
http://de.php.net/manual/en/function.utf8-encode.php
zu behandeln?

Was passiert mit den Zeichen, die schon mit HTML-Entitäten codiert sind?
Dürfen die drin stehenbleiben? Ist die Codierung dann trotzdem noch eindeutig?
Oder würde es reichen, _nur_ eine UTF-Codierung des Textes vorzunehmen?
also:

echo utf8_encode(htmlspecialchars($wilder_text));

?

Fragen über Fragen.

Harzliche Grüße vom Berg
esst mehr http://www.harte-harzer.de

Tom

--
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau