Heizer: Umlaute in Dateinamen

Liebes Forum

Ich programmiere ein kleines CMS, in dem die Dateinamen gleich dem Namen des Inhalt sein soll. Wenn ich also eine Datei mit Änderungen habe, dann soll diese auch "Änderungen.html" heißen könne.

Local hat das geklappt, wenn ich die Datei einfach so nenne, den Link auch so nenne, und in der Adresszeile stand das dann URL-encoded (%C3%84nderungen), und die Datei wurde aufgerufen.
(Mozilla 1.8a auf SuSE Linux, PHP 5.02, Apache 2.0.47)

Ich habe das dann auf einen Testserver hochgeladen (Apache 1.3, PHP 4), und da wurden diese Dateien nicht gefunden (404).

Ich dachte mir, gut, dann kodiere ich die Dateinamen halt selbst. Ich habe die Dateien selbst umbenannt in eine rawurl-codierung, und meine Links weißen den kleichen Namen auf. Allerdings verwandelt mein lokaler Server nun die Namen wieder in nochmals kodierte.

Ein ursprüngliches Ä wird also im Dateinamen und Link zu %C3%84, richtig wäre aber dann %25C3%2584, also die %-Zeichen nocheinmal kodiert.

So mache ich das jetzt halt auch, aber mir schwirrt jetzt der Kopf vor lauter Zeichensätzen und automatischen kodierungen.

Könnte mir vielleicht jemand eine Seite empfehlen, die das wirklich gut und ausführlich behandelt? Ich habe das gefühl, daß sich sonst mein Code immer weiter von dem entfernt, was man "gut" nennen könnte.

Vielen Dank

Heizer

  1. Hi,

    Local hat das geklappt, wenn ich die Datei einfach so nenne, den Link auch so nenne, und in der Adresszeile stand das dann URL-encoded (%C3%84nderungen), und die Datei wurde aufgerufen.

    Dateien kannst Du nennen wie Du willst, sofern es das Filesystem verwalten kann. Die URL - sofern sie dem Dateinamen entsprechen sollte - *muss* jedoch gültig sein, also kodiert. Es ist falsch, sich auf irgendwelche Fehlerkorrekturen einzelner Browser zu verlassen.

    Ich habe das dann auf einen Testserver hochgeladen (Apache 1.3, PHP 4), und da wurden diese Dateien nicht gefunden (404).

    Korrigiere die URL, probiere es erneut, schaue ggf. ins Logfile, was da eigentlich passiert ist.

    Ich dachte mir, gut, dann kodiere ich die Dateinamen halt selbst.

    Die Dateinamen brauchen nicht kodiert zu sein, nur die URL.

    So mache ich das jetzt halt auch, aber mir schwirrt jetzt der Kopf vor lauter Zeichensätzen und automatischen kodierungen.

    Kodiert wird immer an der Stelle, wo Zeichen ungültig sind bzw. eine Sonderbedeutung haben, niemals früher, niemals später.

    Cheatah

    --
    X-Self-Code: sh:( fo:} ch:~ rl:° br:> n4:& ie:% mo:) va:) de:] zu:) fl:{ ss:) ls:~ js:|
    X-Self-Code-Url: http://emmanuel.dammerer.at/selfcode.html
    X-Will-Answer-Email: No
    X-Please-Search-Archive-First: Absolutely Yes
    1. 你好 Cheatah,

      Dateien kannst Du nennen wie Du willst, sofern es das Filesystem
      verwalten kann.

      Das sieht man auch sehr schoen an dem Screenshot hier:

      http://www.defunced.de/pics/screenshots/2004-11-18-192007_2560x1024_scrot.png

      Da lege ich einen Symlink von /bin/ls an und der Name ist das chinesische
      Zeichen fuer »Liste« (名单).

      Uebrigens bin ich echt begeistert, wie problemlos das Forum damit klarkommt.
      Zahlen 1-10 auf Chinesisch:

      一 二 三 四 五 六 七 八 九 十

      Das heutige Datum auf Chinesisch:

      二陵陵四 年, 十一 月, 十八 日
      (2004 Jahr, 11 Monat, 18 Tag)

      再见,
       CK

      --
      No Shoes On Mat!
      http://wwwtech.de/
      1. Hi,

        Uebrigens bin ich echt begeistert, wie problemlos das Forum damit klarkommt.

        Zahlen 1-10 auf Chinesisch:

        一 二 三 四 五 六 七 八 九 十

        ich sehe nur Fragezeichen - muß ich wohl einen chinesischen Zeichensatz installieren, oder?
        Aber warum sehe ich neuerdings in Deiner Anrede und hier

        再见,
        CK

        auch nur noch Fragezeichen?

        freundliche Grüße
        Ingo

        1. hi,

          Aber warum sehe ich neuerdings in Deiner Anrede und hier

          再见,
          CK

          auch nur noch Fragezeichen?

          vermutlich, weil das auch irgendwelche chinesischen schweinereien waren, die er dem Cheatah da an den kopf geworfen hat :-)

          gruß,
          wahsaga

          --
          "Look, that's why there's rules, understand? So that you _think_ before you break 'em."
          1. Hi,

            auch nur noch Fragezeichen?

            vermutlich, weil das auch irgendwelche chinesischen schweinereien waren, die er dem Cheatah da an den kopf geworfen hat :-)

            hmm... aber nicht nur ihm: https://forum.selfhtml.org/?t=94552&m=572433

            freundliche Grüße
            Ingo

          2. 你好 wahsaga,

            vermutlich, weil das auch irgendwelche chinesischen schweinereien waren,
            die er dem Cheatah da an den kopf geworfen hat :-)

            Hehe.

            Da faellt mir ein, es gibt im Chinesischen ein Wort-Paar, das klingt genau
            so wie “tschuess”. Aber wenn man es uebersetzt, bekommt man als Bedeutung
            “Geh sterben” ;-)

            Genau so gibt es ein Wort, das fuer ungeuebte Ohren so klingt wie das
            italienische “ciao”, aber es ist das ugspr. Wort fuer “ficken” *g*

            再见,
             CK

            --
            Ich bewundere wirklich den Sinn der Bienen für kollektive Verantwortung. Obwohl sich einzelne Bienen hin und wieder bekämpfen, herrscht zwischen Ihnen grundsätzlich ein starkes Gefühl für Eintracht und Zusammenarbeit. Wir Menschen gelten als sehr viel weiter entwickelt, doch mitunter rangieren wir sogar hinter kleinen Insekten.
            http://wwwtech.de/
            1. hi,

              Da faellt mir ein, es gibt im Chinesischen ein Wort-Paar, das klingt genau
              so wie “tschuess”. Aber wenn man es uebersetzt, bekommt man als Bedeutung
              “Geh sterben” ;-)

              wenn einem der gesprächspartner zu sehr auf die nerven geht, ist ja auch letzteres eine passable verabschiedung.

              Genau so gibt es ein Wort, das fuer ungeuebte Ohren so klingt wie das
              italienische “ciao”, aber es ist das ugspr. Wort fuer “ficken” *g*

              in italien sagt man "ciao" ja auch zur begrüßung - und was will der (klischee-)italiener, wenn er eine frau anspricht? na also, da schließt sich der kreis ...

              scnr,
              wahsaga

              --
              "Look, that's why there's rules, understand? So that you _think_ before you break 'em."
        2. 你好 Ingo,

          ich sehe nur Fragezeichen - muß ich wohl einen chinesischen Zeichensatz
          installieren, oder?

          Ja, bzw. die entsprechenden Schriften musst du installieren. Unter Windows
          geht das z. B. mit dem hier:

          http://www.uni-koeln.de/phil-fak/ostas/download/gbfont.exe
            http://www.uni-koeln.de/phil-fak/ostas/download/big5font.exe

          Dann musst du als Font fuer die Sprache “Traditionelles Chinesisch” den
          Font “MingLiU” einstellen, fuer “Chinesisch (GB)” den Font “MS Song” oder
          “MS Hei”.

          Aber warum sehe ich neuerdings in Deiner Anrede und hier

          再见,
          CK

          auch nur noch Fragezeichen?

          Weil ich jetzt chinesische Schriftzeichen benutze. Die Begruessung ist in
          Pinyin (eine Lautschrift) nǐhǎo (zu dt. so viel wie “Guten Tag” oder
          “Wie geht es dir?”), die Verabschiedung ist in Pinyin zài jiàn (zu dt.
          soviel wie “Auf Wiedersehen”, “Leb Wohl”).

          再见,
           CK

          --
          Willst du die Freuden dieser Welt geniessen, so musst du auch ihr Leid erdulden.
          http://wwwtech.de/
          1. Hi,

            Ja, bzw. die entsprechenden Schriften musst du installieren.

            Naja, soviel wird mir das aber auch nicht bringen. Ob ich nun Fragezeichen oder chinesische Symbole sehe... die Fragezeichen passen da eigentlich schon ganz gut ;-)

            freundliche Grüße
            Ingo

            1. hi,

              Ob ich nun Fragezeichen oder chinesische Symbole sehe... die Fragezeichen passen da eigentlich schon ganz gut ;-)

              das würde zumindest mal plausibel erklären, warum so viele leute ihre fragen mit multiplen fragezeichen abschließen - da steckt in wirklichkeit noch eine weitere frage auf chinesisch drin!

              gruß,
              wahsaga

              --
              "Look, that's why there's rules, understand? So that you _think_ before you break 'em."
          2. Hi Christian,

            Weil ich jetzt chinesische Schriftzeichen benutze. Die Begruessung ist in Pinyin (eine Lautschrift) nǐhǎo (zu dt. so viel wie “Guten Tag” oder “Wie geht es dir?”)

            Ich dachte, dass hieße: "Du gut!"

            die Verabschiedung ist in Pinyin zài jiàn (zu dt. soviel wie “Auf Wiedersehen”, “Leb Wohl”).

            Schöner fände ich: "Nächsten Himmel wieder gucken!"

            Viele Grüße
            Mathias Bigge

            1. 你好 Mathias,

              Weil ich jetzt chinesische Schriftzeichen benutze. Die Begruessung ist
              in Pinyin (eine Lautschrift) nǐhǎo (zu dt. so viel wie “Guten Tag” oder
              “Wie geht es dir?”)
              Ich dachte, dass hieße: "Du gut!"

              Nur, wenn man es woertlich uebersetzt ;-)
              Wo wir gerade dabei sind: das Wort 好 (Pinyin hǎo) besteht aus zwei
              Zeichen: das linke Zeichen bedeutet fuer sich allein “Frau”, das rechte
              Zeichen bedeutet “Sohn”. Konklusion: die Frau ist nur dann gut, wenn sie
              einen Sohn hat. Ganz schoen Matchohaft, die alten Chinesen ;-)

              再见,
               CK

              --
              So, wie ein Teil ist, ist das Ganze.
              http://wwwtech.de/
              1. Hi,

                Wo wir gerade dabei sind: das Wort 好 (Pinyin hǎo) besteht aus zwei
                Zeichen: das linke Zeichen bedeutet fuer sich allein “Frau”, das rechte
                Zeichen bedeutet “Sohn”. Konklusion: die Frau ist nur dann gut, wenn sie
                einen Sohn hat. Ganz schoen Matchohaft, die alten Chinesen ;-)

                Die aktuelle chinesische Regierung interpretiert das wohl etwas anders:

                Die Frau ist nur dann gut, wenn sie NUR EINEN Sohn hat ...

                cu,
                Andreas

                --
                Warum nennt sich Andreas hier MudGuard?
                Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
                1. 你好 MudGuard,

                  Die aktuelle chinesische Regierung interpretiert das wohl etwas anders:

                  Die Frau ist nur dann gut, wenn sie NUR EINEN Sohn hat ...

                  Hehe, das ist wohl besser geworden: inzwischen duerfen sie auch eine
                  Tochter haben *scnr*

                  再见,
                   CK

                  --
                  Beware Evildoers for my deed is done and every little damsel in distress will be shelted!
                  http://wwwtech.de/
                  1. Hi,

                    Die aktuelle chinesische Regierung interpretiert das wohl etwas anders:
                    Die Frau ist nur dann gut, wenn sie NUR EINEN Sohn hat ...
                    Hehe, das ist wohl besser geworden: inzwischen duerfen sie auch eine
                    Tochter haben *scnr*

                    Zusätzlich oder stattdessen?

                    cu,
                    Andreas

                    --
                    Warum nennt sich Andreas hier MudGuard?
                    Fachfragen per E-Mail halte ich für unverschämt und werde entsprechende E-Mails nicht beantworten. Für Fachfragen ist das Forum da.
                    1. Hi MudGuard,

                      Die aktuelle chinesische Regierung interpretiert das wohl
                      etwas anders:
                      Die Frau ist nur dann gut, wenn sie NUR EINEN Sohn hat ...
                      Hehe, das ist wohl besser geworden: inzwischen duerfen sie auch
                      eine Tochter haben *scnr*

                      Zusätzlich oder stattdessen?

                      Gute Frage, ich bin mir jetzt nicht sicher. Min hat mir nur
                      erzaehlt, dass Maedchen z. B. nicht mehr ausgesetzt werden und es
                      schon lange nicht mehr so verpoent ist, wie es noch vor 20 (oder so)
                      Jahren war.

                      Gruesse,
                       CK

        3. 你好 Ingo,

          hier mal ein Screenshot, wie es bei mir aussieht:

          http://www.defunced.de/pics/screenshots/2004-11-18-211431_2560x1024_scrot.png

          Das hat doch eindeutig einen Coolness-Faktor, oder? ;-))

          再见,
           CK

          --
          Die Wirklichkeit hat weder ein Inneres, noch ein Äußeres, noch ein Zentrum.
          http://wwwtech.de/
          1. Hi,

            Das hat doch eindeutig einen Coolness-Faktor, oder? ;-))

            zweifellos. Die chinesischen, aber auch die japanischen Schriftzeichen sind sehr dekorativ.

            freundliche Grüße
            Ingo

  2. Hallo

    Wie wär's bei Erstellung der Dateien mit "Ae" statt "Ä" u.s.w.?

    Tschö, Auge

    --
    Die Musik drückt aus, was nicht gesagt werden kann und worüber es unmöglich ist zu schweigen.
    (Victor Hugo)
  3. Ich danke euch beiden, ich werde wohl nicht darum herumkommen, noch mal über alles drüber zu gehen, aber was solls.

    Wenn ich das richtig verstanden habe, dann muß ich einfach nur alle Links encoden, und sonst bleibt alles beim alten, oder?

    Das mit den Umlautumwschreibungen habe ich mir auch überlegt, aber die Dateinamen werden aktiv verwendet. Links zu allen Seiten werden automatisch generiert, und der Link auf die Datei "Änderungen" soll eben auch "Änderungen" heißen, nicht "Aenderungen".

    Das wäre ja auch nur eine Kodierung, allerdings denke ich, daß das bestehende System mir die weitesten Möglichkeiten läßt, da theoretisch ja jedes UNICODE Zeichen als Name verwendet werden kann (wenn es das Dateisystem erlaubt).

    Danke nochmal

    Heizer