Sven Rautenberg: Unklarheiten im Quelltext

Beitrag lesen

Moin!

wie stelle ich denn am besten eine Seite auf UTF-8 um.

Hängt davon ab, aus was sie derzeit besteht.

Gibt es ein Konvertierprogramm?
Wie muss ich dann Sonderzeichen eingeben?
ä,ö,ü .... wie bisher mit den auf der deutschen Tastatur vorhandenen Tasten?

Dein Editor muß UTF-8 unterstützen. Derzeit unterstützt er ja wohl auch schon ISO-8859-1. Am Tippen der Umlaute etc. ändert sich gar nichts. Auch in ISO-8859-1 müssen die nicht als Entity geschrieben werden.

Wie Zeichen, die nicht vorhanden sind, z.B. franz. Sonderzeichen?

In UTF-8 sind alle Zeichen vorhanden. Und franz. Sonderzeichen sind in ISO-8859-1 auch vorhanden.

Im Prinzip wäre ein simples Szenario: Seite im Editor laden, auf UTF-8 umschalten, Meta-Tag abändern, ggf. Server-Konfiguration abändern (für den HTTP-Header "Content-Type", da darf zukünftig nicht mehr ISO-8859-1 angegeben sein, UTF-8 wäre wünschenswert, ohne weitere Angabe gilt das Meta-Tag als Fallback), Seite speichern und neu hochladen.

Wobei es vom Editor abhängt, ob das "Umschalten" so simpel funktioniert. Ist der Editor etwas unfähiger, weil er die alten Umlaute durch das Umschalten nicht in UTF-8 konvertiert, sondern die Bytewerte unverändert läßt und als ungültige UTF-8-Zeichen anzeigt, hilft folgender Trick:
Seite laden, Quelltext komplett markieren, in die Zwischenablage kopieren oder ausschneiden, Codierung umschalten, Quelltext wieder einfügen. Da die Zwischenablage mit Unicode arbeitet, werden die wahren Umlaute dort hineinkopiert und auch wieder als wahrer Umlaut in den Editor eingefügt.

- Sven Rautenberg

--
"Love your nation - respect the others."