Bademeister: Notepad++ und Zeicheneingabe

Hi,
eine Frage zum Notepadd++ (Version. 5.0):

Wie bekomme ich beliebige Unicode-Zeichen mittels der Tastatur in ein File?

Was ich dazu nach laenglicher Suche gefunden habe, war: ALT gedrueckt halten und die Unicode-Position des Zeichens dezimal ueber den Ziffernblock eingeben (siehe etwa hier). Ich habe das anhand dieser Zeichentabelle mit einigen Zeichen versucht. Bei Zeichen des Blocks "Latin-1 Supplement" etwa funktioniert es wie gewuenscht, aber bei dem Block "Greek and Coptic" etwa produziere ich voellig andere Zeichen (und das ist der Block, den ich gerade konkret benoetige).

Das File ist in UTF-8 gespeichert, die daraus resultierende HTML-Ressource als UTF-8-codiert gekennzeichnet, und auch mein Browser (Firefox 2) stellt die falschen Zeichen dar. Es liegt also nicht etwa daran, dass der Schriftart im Notepad die entsprechenden Zeichen fehlen.

Die Seite ist leider nicht online, daher kann ich keinen Link bereitstellen.

Was verstehe ich denn da falsch bei der Sache?

Danke, viele Gruesse
der Bademeister

  1. Wie bekomme ich beliebige Unicode-Zeichen mittels der Tastatur in ein File?

    STRG+C, STRG+V ?!

    1. Hi suit,

      STRG+C, STRG+V ?!

      Danke. Praezision ist alles bei der Fagestellung - mein Fehler ;-)

      Ich wuerde gerne Zeichen, die ich oefters benoetige, einfach eintippen koennen. Und wenn es so ist, dass man mit editorinternen Mitteln nicht alle Zeichen produzieren kann, dann finde ich das konzeptionell schon etwas daemlich, wenn ich ehrlich bin...

      viele Gruesse
      der Bademeister

      1. echo $begrüßung;

        Ich wuerde gerne Zeichen, die ich oefters benoetige, einfach eintippen koennen. Und wenn es so ist, dass man mit editorinternen Mitteln nicht alle Zeichen produzieren kann, dann finde ich das konzeptionell schon etwas daemlich, wenn ich ehrlich bin...

        Die Schuld trägt im Grunde das Betriebssystem, nicht der Editor. Der könnte höchstens die im BS fehlende Funktionalität irgendwie zur Verfügung stellen. Du würdest dich aber bedanken, wenn jede Applikation da ein eigenes Süppchen kochte.

        Wenn dir einige wenige Zeichen reichen, hätte SELTHTML den Artikel Windows-Tastaturlayout anpassen als mögliche Abhilfe im Angebot.

        echo "$verabschiedung $name";

        1. Moin!

          Die Schuld trägt im Grunde das Betriebssystem, nicht der Editor. Der könnte höchstens die im BS fehlende Funktionalität irgendwie zur Verfügung stellen. Du würdest dich aber bedanken, wenn jede Applikation da ein eigenes Süppchen kochte.

          Wenn ich die Textarea meines Browsers Opera mit Alt+0915 malträtiere, kommt Γ raus wie gewünscht.

          Tue ich das in Notepad++, kommt das Anführungszeichen heraus. Nutze ich Firefox, passiert dasselbe in der hiesigen Textarea. Hm...

          Ich weiß schon, warum Opera der bessere Browser ist... ;)

          - Sven Rautenberg

          1. Ich weiß schon, warum Opera der bessere Browser ist... ;)

            Das denke ich mir auch jedes mal und verwende trotzdem immer wieder FireFox :(

  2. echo $begrüßung;

    Wie bekomme ich beliebige Unicode-Zeichen mittels der Tastatur in ein File?

    Alle? Nicht mit Windows-Bordmitteln.

    Was ich dazu nach laenglicher Suche gefunden habe, war: ALT gedrueckt halten und die Unicode-Position des Zeichens dezimal ueber den Ziffernblock eingeben (siehe etwa hier).

    Das ist nicht richtig. Mit Alt+0+Ziffern lassen sich nur Zeichen aus Windows-1252 eingeben (zumindest mit deutschem und englischem Windows in der Standardinstallation). Du kannst das im Programm Zeichentabelle (Character Map) aus dem Menü Zubehör ansehen. Da ist rechts unten die Tastenkombination angezeigt. Andere Möglichkeiten sind mir nicht bekannt. Es gibt sicher Programme von anderen Herstellern und die Möglichkeit mit sprachspezifischen Tastaturtreibern zumindest die für die Sprache relavanten Zeichen einzugeben.

    Das File ist in UTF-8 gespeichert, die daraus resultierende HTML-Ressource als UTF-8-codiert gekennzeichnet, und auch mein Browser (Firefox 2) stellt die falschen Zeichen dar. Es liegt also nicht etwa daran, dass der Schriftart im Notepad die entsprechenden Zeichen fehlen.

    Gib bitte ein konkretes Beispiel, dann kann man auch konkret raten, was da wie schiefläuft.

    Mit dem Browser kannst du über das Menü Ansicht->(Zeichen)kodierung mal eine andere einstellen und schauen, ob die Zeichen mit dieser richtig interpretiert werden. Wenn ja, dann sind die Zeichen in dieser Kodierung im Dokument abgelegt.

    echo "$verabschiedung $name";

    1. Hi dedlfix,
      danke schon mal fuer die Hilfe.

      Gib bitte ein konkretes Beispiel, dann kann man auch konkret raten, was da wie schiefläuft.

      An der Unicode-Position 915 (dezimal) is das Γ (grosses Gamma). Die Eingabe ALT+<0915> im Notepad++ gibt mir “. Letzteres in ISO-8859-1 angesehen (im Browser oder Notepad++), ergibt “.

      Es ist offenbar schon ein vernuenftig UTF-8-codiertes Zeichen - in UTF-8 sind sich Browser und Editor auch einig, dass es so “ aussieht. Nur weiss ich nicht, welches, und was es mit der Ziffernfolge 0915 zu tun hat.

      viele Gruesse,
      der Bademeister

      1. echo $begrüßung;

        An der Unicode-Position 915 (dezimal) is das Γ (grosses Gamma). Die Eingabe ALT+<0915> im Notepad++ gibt mir “. Letzteres in ISO-8859-1 angesehen (im Browser oder Notepad++), ergibt “.

        Das Zeichen “ befindet sich (nicht in ISO-8859-1 aber) in Windows-1252 an Position 0x93, Bitmuster: 1001 0011. Die Zahl 915 hat das Bitmuster 11 1001 0011. Siehst du den Zusammenhang?

        Es ist offenbar schon ein vernuenftig UTF-8-codiertes Zeichen - in UTF-8 sind sich Browser und Editor auch einig, dass es so “ aussieht.

        Die Eingabe von Zeichen hat mit Kodierung, in der irgendwann später mal eine Datei gespeichert wird nichts zu tun. Deine Einabe bewirkte, dass Windows das Zeichen “ an die Applikation gab. In Unicode steht das “ an Position 201C, welches als UTF-8 kodiert E2 80 9C und als Windows-1252 dekodiert “ ergibt. ISO-8859-1 ist es nicht, denn das kennt kein € und kein œ oder allgemein gesagt keine Zeichen an den Positionen 80..9F. Der Browser ist so frei, bei Zeichen in diesem Bereich Windows-1252 anzunehmen.

        echo "$verabschiedung $name";

        1. Hi,

          alles klar, vielen Dank. Mir war nicht bewusst, dass das ganze nur eine betriebssysteminterne Funktionalitaet ist. Ich hatte eigentlich nach einer individuellen Loesung des Editors gesucht. Und sehe - dies als Antwort auf Dein Posting weiter unten - kein Grundsatzproblem damit, wenn Editoren das individuell loesen.

          Danke fuer den Link zu dem Artikel. Er hilft mir hier leider nicht weiter - es geht um einen Unirechner, auf dem ich weitgehend mit der vorhandenen Software auskommen muss; zu Hause benutze ich das Notepad sowieso nicht - aber ist trotzdem recht interessant.

          Viele Gruesse
          der Bademeister