Ashura: Zeichenkodierung einer Datei auslesen

Beitrag lesen

Hallo Tom.

Da aber UTF-8 nur eine Untermenge von ASCII ist (also 7bit-Codierung), könnte da doch schon einmal ein Kriterium sein: eine Datei, die auch das achte Bit benutzt, kan  nicht UTF-8 sein. Oder habe ich da was falsch verstanden?

http://de.wikipedia.org/wiki/UTF-8

Ich werde mir das Ganze noch einmal genau durchlesen, vielleich finde ich ja einen brauchbaren Punkt, an dem ich ansetzen kann.

Diese UTF-8-Kacke kommt mir vor wie ein Virus, der langsam und allmählich die in Jahrzehnten geschaffene Codebasis auffrisst. Leider muss ich mich auch damit auseinandersetzen.

Warum „leider“? Was gefällt dir an der Geschichte mit den erweiterten Zeichensätzen (hier eben UTF-8) nicht?

Wir weren und hier zu diesem Thema also noch öfter begegenen.

Na dann: Happy (En)Coding. :-)

Einen schönen Sonntag noch.

Gruß, Ashura

--
Selfcode: sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:) fl:( ss:) ls:[ js:|
30 Days to becoming an Opera8 Lover -- Day 21: Toolbars
Meine Browser: Opera 8.02 | Firefox 1.0.6 | Lynx 2.8.5 | Netscape 4.7 | IE 6.0
[Deshalb frei! - Argumente pro freie Software]