Ashura: Zeichenkodierung einer Datei auslesen

Beitrag lesen

Hallo Candid.

Aber wie _genau_ kann ich dies überprüfen?

Naja, binär 11111000 entspricht hexadezimal F8. 11111111 wäre FF. Das bringt die schonmal weiter, zum Beispiel in preg_match kannst du dann das Zeichen [\xf8-\xff] überprüfen. Ich hoffe, das bringt dir was.

Ich werde darauf aufbauend ein wenig experimentieren, danke.

Anders gefragt: wie wandele ich einen String in seine Binärform um?

Ein String ist ja schon in Binärform gespeichert, wenn du aber zum Beispiel den Binärwert eines Zeichens herausfinden willst, bringt dich dies vielleicht weiter:
[link:http://php.net/decbin@title=decbin]([link:http://php.net/ord@title=ord]($zeichen))

Unter dem Bereich „Math“ habe ich natürlich nicht gesucht, noch einmal danke.

Das brauche ich gar nicht. Ich möchte nur wissen, ob die Datei UTF-8-kodiert ist

Beachte, dass obige Möglichkeit immernoch nicht sicher ist, es gibt immernoch Möglichkeiten, bei denen du UTF-8 nicht einwandfrei identifizieren kannst.

Gemach, gemach, wir werden sehen. ;-)

Einen schönen Sonntag noch.

Gruß, Ashura

--
Selfcode: sh:( fo:} ch:? rl:( br: n4:~ ie:{ mo:| va:) de:> zu:) fl:( ss:) ls:[ js:|
30 Days to becoming an Opera8 Lover -- Day 21: Toolbars
Meine Browser: Opera 8.02 | Firefox 1.0.6 | Lynx 2.8.5 | Netscape 4.7 | IE 6.0
[Deshalb frei! - Argumente pro freie Software]