Hello,
Da aber UTF-8 nur eine Untermenge von ASCII ist (also 7bit-Codierung), könnte da doch schon einmal ein Kriterium sein: eine Datei, die auch das achte Bit benutzt, kan nicht UTF-8 sein. Oder habe ich da was falsch verstanden?
Sorry, das war falsch.
Es werden alle 8 Bit benutzt.
Das Bit 7 (80h 128d) wird eben zur Kennzeichnung der Umschaltung benutzt...
Der Ansatz von Candid https://forum.selfhtml.org/?t=112485&m=711482 ist da schon besser.
Schau Dir doch den UTF-8-Code mal im Hex-Editor an:
Ich kämpfe mich da gerade durch, wie man utf-8 und PHP unter einen Hut bringt.
Welchen Header sendet der Webserver für die Zeichenkodierung?
Reicht es, das charset im Header zu setzen?
Wer hat Vorrang? Der HTTP-Header oder das Meta-Äquivalent?
<meta http-equiv="content-type" content="text/html; charset=ISO-8859-1">
reicht es, alle Ausgaben, die PHP produziert mit utf8_encode
http://de.php.net/manual/en/function.utf8-encode.php
zu behandeln?
Was passiert mit den Zeichen, die schon mit HTML-Entitäten codiert sind?
Dürfen die drin stehenbleiben? Ist die Codierung dann trotzdem noch eindeutig?
Oder würde es reichen, _nur_ eine UTF-Codierung des Textes vorzunehmen?
also:
echo utf8_encode(htmlspecialchars($wilder_text));
?
Fragen über Fragen.
Harzliche Grüße vom Berg
esst mehr http://www.harte-harzer.de
Tom
Fortschritt entsteht nur durch die Auseinandersetzung der Kreativen
Nur selber lernen macht schlau