Ashura: Zeichenkodierung einer Datei auslesen

Beitrag lesen

Hallo dedlfix.

Solange keine UTF-8-"Syntax"-Fehler vorkommen, kann ein Text UTF-8 oder beispielsweise ISO-8859-1 sein.

Die Bytelänge variiert aber.

Beispielsatz: Das deutsche scharfe s sieht UTF-8-kodiert so aus: ß

ANSI-Binär : 11011111

UTF-8-Binär: 11000011 10011111

Beachte die Nichtverwendung des Zeichens ß. Sonst wäre der Text kein gültiges UTF-8 mehr.

Weiß ich. Was möchtest du mir also sagen?

Einen schönen Montag noch.

Gruß, Ashura

--
Selfcode: sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:) fl:( ss:) ls:[ js:|
30 Days to becoming an Opera8 Lover -- Day 21: Toolbars
Meine Browser: Opera 8.02 | Firefox 1.0.6 | Lynx 2.8.5 | Netscape 4.7 | IE 6.0
[Deshalb frei! - Argumente pro freie Software]