Hameeelh: SEO:Meinung zu Idee zum autom. Erstellen eines guten Dateinamens

hi,
danke für die vielen Antworten auf meine letzte Nachricht - ich hab's dann doch irgendwie hinbekommen: Die ganze E-Mail-Funktion habe ich neu geschrieben, aber wenigstens hat es sich gelohnt.

Nun will ich aus zwei Überschriften einen sinnvollen Dateinamen erstellen. Das Grundprinzip ist einfach. Ich teile die Wörter in verschiedene Wortgruppen ein (unterschiedliche Wichtigkeit): das (Haupt)stichwort der Unterüberschrift ist z.B. viel wichtiger als einfach irgendein Sinn(volles )wort aus der Überschrift. Je wichtiger ein Wort - besser gesagt die Gruppe des Wortes - ist, umso wahrscheinlicher ist es, dass es wirklich in den Dateinamen (besteht aus allen "Trefferwörtern") kommt. Unten im "Anhang" steht das Ganze noch genauer beschrieben.

Bitte lest es euch durch und sagt mir dann, ob diese Idee gut ist oder was ihr verbessern würdet. Gerne auch andere Ansätze.

Vielen Dank!
lg hmlh.

PS: Sollte irgendetwas unverständlich sein, bitte sagt mir, was und ich "spezifiziere"!

---
{KONZEPT}

Sinnwörter = aus mehr als vier Zeichen haben oder nur aus Großbuchstaben bestehend (XML und HTML sind ja auch sinnvolle Wörter); von durch Leerzeichen, Bindestrich, Stringbeginn oder Stringende abgegrenzt

Sinnsubstantiva = Sinnwörter mit großem Anfangsbuchstaben

Stichwort = 1. Sinnsubstantiv in der Zeichenkette, dass:
  - hinter dem ersten Doppelpunkt steht, falls es Doppelpunkte gibt
  - außerhalb von Klammern {} steht
  - nicht am Anfang der Zeichenkette steht (falls mehrere Wörter in der Zeichenkette stehen)
  - nicht vor oder nach "/", "oder", "&", "und" stehen

Schlüsselwort = ein bestimmtes Wort, dass aus SEO-Gründen so oft wie nur möglich auf der Seite vorkommen sollte

Trefferwörter = Zeichenkette, in der die Wörter (kurze Wörter vor langen) aus den Wortgruppen (Reihenfolge: 1, 2, ... 5, 6) nacheinander eingefügt werden - solange die Maximallänge noch nicht überschritten wird; genaueres:
  - Maximallänge: 5 Wörter und 45 Zeichen (an jedes Trefferwort wird noch ein Bindestrich angehängt! - wird auch bei den 45 Zeichen mitgezählt) - je nachdem, was früher eintritt; überschreitet man mit einem Wort die Maximallänge vom Trefferwörterstring, wird dieses Wort und alle weiteren Wörter NICHT MEHR eingefügt
        Beispiel: Ausgang:  Wortgruppe1["Gruppendynamik"]
                            Länge EINER  123456789012345
                                 ZEHNER  0        10
                            Wortgruppe2["Information", "Herbsttagen", "Verabschiedung"]
                            Länge EINER  678901234567   890124567890   123456789012345
                                 ZEHNER      20           30       40           50
                            Wortgruppe3["Mutter"]
                            Länge EINER  6789012
                                 ZEHNER      60
                  Ergebnis: Wortgruppe1["Gruppendynamik"]
                            Wortgruppe2["Information", "Herbsttagen" /* NACH 39. ZEICHEN HIER ABGESCHNITTEN*/]
                            Wortgruppe3[EMPTY]
  - Wort kommt mehrfach vor: Wort aus der Gruppe mit der größeren Ziffer wird entfernt (in der gleichen Gruppe ist es egal, welches Wort entfernt wird)
        Beispiel: Ausgang:  Wortgruppe1["Verabschiedung"]
                            Wortgruppe2["Information", "Herbsttag", "Verabschiedung", "Tier", "Tier"]
                            Wortgruppe3["Herbsttag"]
                  Ergebnis: Wortgruppe1["Verabschiedung"]
                            Wortgruppe2["Information", "Herbsttag", "Tier"]
                            Wortgruppe3[EMPTY]
  - Reihenfolge des Einfügens der Wörter innerhalb der Wortgruppen, wenn mehrere Sinnwörter, Sinnsubstantiva etc. gefunden werden: kürzere vor längeren Wörtern (bei längeren Wörtern ist es dadurch wahrscheinlicher, dass Sie wegen der Maximallänge nicht mehr genannt werden)
        Beispiel: Ausgang:  Wortgruppe["Verabschiedung", "Leben", "Hund", "Leiche"]
                  Ergebnis: Wortgruppe["Hund", "Leben", "Leiche", "Verabschiedung"]
  - Wortgruppen (umso kleiner die Ziffer, umso früher werden die Wörter in Trefferwörter übernommen - bei Wortgruppen mit größeren Ziffern ist es wahrscheinlicher, dass die Wörter dieser Wortgruppen wegen der Maximallänge nicht mehr genannt werden):
    1. Stichwort der Kurzüberschrift (falls ein Stichwort gefunden wurde)
    2. Sinnsubstantiva in der Kurzüberschrift
    3. Stichwort der Langüberschrift (falls ein Stichwort gefunden wurde)
    4. Sinnwörter in der Kurzüberschrift
    5. Sinnsubstantiva in der Langüberschrift
    6. Schlüssselwort

Dateiname = besteht aus allen Trefferwörtern getrennt durch einen Bindestrich

  1. Nun will ich aus zwei Überschriften einen sinnvollen Dateinamen erstellen.

    Das Grundprinzip ist einfach. Ich teile die Wörter in verschiedene Wortgruppen ein (unterschiedliche Wichtigkeit): das (Haupt)stichwort der Unterüberschrift ist z.B. viel wichtiger als einfach irgendein Sinn(volles )wort aus der Überschrift.

    Dateinamen sollten auf bestimmten BSen am Besten nicht zu lange sein, da der Pfad eine Längenbeschränkung aufweist.
    Deine Überschrift kann nicht-ASCII-Zeichen enthalten. Du solltest abklären, ob das für deine Zwecke sinnvoll ist.

    Je wichtiger ein Wort - besser gesagt die Gruppe des Wortes - ist, umso wahrscheinlicher ist es, dass es wirklich in den Dateinamen (besteht aus allen "Trefferwörtern") kommt. Unten im "Anhang" steht das Ganze noch genauer beschrieben.

    Unterschiedliche Dateiinhalte sollten unterschiedliche Dateinamen haben.
    Dein Algo berücksichtigt dies nicht. Es besteht lediglich eine gewisse Wahrscheinlichkeit, dass dem so ist.

    Da ich nicht weiss, wie deine Überschriften aussehen, sei dir empfohlen, Tests zu schreiben.

    Ich bin im übrigen nicht überzeugt, ob die Ansammlung von Stichworten wirklich ein guter Dateiname ist.
    Ich denke da vor allem an die übliche Funktion eines Dateinamens statt an SEO.

    mfg Beat

    --
    ><o(((°>           ><o(((°>
       <°)))o><                     ><o(((°>o
    Der Valigator leibt diese Fische
    1. Nun will ich aus zwei Überschriften einen sinnvollen Dateinamen erstellen.

      Das Grundprinzip ist einfach. Ich teile die Wörter in verschiedene Wortgruppen ein (unterschiedliche Wichtigkeit): das (Haupt)stichwort der Unterüberschrift ist z.B. viel wichtiger als einfach irgendein Sinn(volles )wort aus der Überschrift.

      Dateinamen sollten auf bestimmten BSen am Besten nicht zu lange sein, da der Pfad eine Längenbeschränkung aufweist.

      Durch die Maximallänge von 52 für Pfad/Domain etc. zusammen und 45 für den Dateinamen komme ich noch immer "bequem" unter 100 Zeichen. Und das soll ja die "magische Grenze" ;-) sein - laut vielen Blogs.

      Deine Überschrift kann nicht-ASCII-Zeichen enthalten. Du solltest abklären, ob das für deine Zwecke sinnvoll ist.

      Es ist eine deutsch/skandinavische Seite. Und die hier üblichen Umlaute lassen sich leicht umschreiben: z.B. ae, oe, ß = ss . Außerdem wird alles in Kleinbuchstaben umgewandelt

      Je wichtiger ein Wort - besser gesagt die Gruppe des Wortes - ist, umso wahrscheinlicher ist es, dass es wirklich in den Dateinamen (besteht aus allen "Trefferwörtern") kommt. Unten im "Anhang" steht das Ganze noch genauer beschrieben.

      Unterschiedliche Dateiinhalte sollten unterschiedliche Dateinamen haben.
      Dein Algo berücksichtigt dies nicht. Es besteht lediglich eine gewisse Wahrscheinlichkeit, dass dem so ist.

      Hier bin ich noch am Überlegen. Wahrscheinlich ist es so am Einfachsten (Pseudocode):

        
      while(existiert_bereits($Pfad, $Dateiname, $Endung))  
        $Dateiname = $Dateiname + '-' + SCHLUESSELWORT  
      
      

      Da ich nicht weiss, wie deine Überschriften aussehen, sei dir empfohlen, Tests zu schreiben.

      Ich habe "im Kopf" die ganze "Algo" :-) einmal auf ca. 80% aller Seiten "durchgespielt". (Fast) immer komme ich genau auf die Namen, die ich auch händisch vergeben würde. Meist hätte ich zwar ein Wort des Dateinamens bei hündischer Vergabe ausgelassen, aber es ist allemal besser als die von unserem "SEO-ahnungslosen" Webmaster (z.B. "txt-ms2.pdf").

      Ich bin im übrigen nicht überzeugt, ob die Ansammlung von Stichworten wirklich ein guter Dateiname ist.
      Ich denke da vor allem an die übliche Funktion eines Dateinamens statt an SEO.

      Die meisten Leute werden die Seiten wohl über die Startseite und Navigation erreichen. Aber man kann ja das ganze von vier auf drei Maximalwörter kürzen etc. Welche Beschränkungen würdest du vorschlagen? Oder allgemeiner: Hast du konkrete Verbesserungsvorschläge?

      thx&lghmlh.

      PS: Was hälst du von der Idee folgender Definition um Adjektive mit großem Anfangsbuchstaben wie bei "Düsseldorfer Seefest" nicht als "Sinnsubstantiv" zu deklarieren:

      Sinnsubstantiva = Sinnwörter mit großem Anfangsbuchstaben, die nicht vor GENAU EINEM anderen Sinnsubstantiv stehen

      1. Hallo,

        Dateinamen sollten auf bestimmten BSen am Besten nicht zu lange sein, da der Pfad eine Längenbeschränkung aufweist.
        Durch die Maximallänge von 52 für Pfad/Domain etc. zusammen und 45 für den Dateinamen komme ich noch immer "bequem" unter 100 Zeichen. Und das soll ja die "magische Grenze" ;-) sein - laut vielen Blogs.

        also geht es in Wirklichkeit gar nicht um Dateinamen, sondern um URLs bzw. Ressourcennamen?

        Meist hätte ich zwar ein Wort des Dateinamens bei hündischer Vergabe ausgelassen

        Du lässt Dateinamen von Hunden ermitteln? Naja, die sollen ja sehr lernfähig sein. :-)

        So long,
         Martin

        --
        Zwei Mäuse treiben's miteinander. Sagt der Mäuserich: "Hoffentlich ist nicht wieder alles für die Katz."
        Selfcode: fo:) ch:{ rl:| br:< n4:( ie:| mo:| va:) de:] zu:) fl:{ ss:) ls:µ js:(
        1. hi,

          also geht es in Wirklichkeit gar nicht um Dateinamen, sondern um URLs bzw. Ressourcennamen?

          Naja, eigentlich beides. Der Webmaster gibt erstellt eine HTML-Seite mit beliebigem Dateinamen. Diese wird dann automatisch verarbeitet, in einen neuen Unterordner kopiert und dort haben Sie dann den generierten Namen. Und das wirkt sich dann auch auf die URL aus, da meine .htaccess wie folgt handeln soll: http://www.domain.at/homepage/[Kategorie]/[Unterseite] => /root/meinordner/ordnermitdenverarbeitetendateien/[Kategorie]__[Unterseite].php

          Meist hätte ich zwar ein Wort des Dateinamens bei hündischer [Das SELFHTML-Rechtschreibtool hat "händischer" als Rechtschreibfehler gerechnet und ich habe den Verbesserungsvorschlag nicht genau {genung} gelesen] Vergabe ausgelassen
          Du lässt Dateinamen von Hunden ermitteln? Naja, die sollen ja sehr lernfähig sein. :-)

          Und ich dachte Rudeltiere und Computer wären Erzfeinde ;-)

          lghmlh.

          1. Und ich dachte Rudeltiere und Computer wären Erzfeinde ;-)

            Ich dachte bisher Computer, besonders Server sind Rudeltiere - oft werde diese sogar in Käfighaltung in Farmen eingesperrt :p

            1. Hallo,

              Ich dachte bisher Computer, besonders Server sind Rudeltiere - oft werde diese sogar in Käfighaltung in Farmen eingesperrt :p

              ich bevorzuge freilaufende

              vg ichbinich

              --
              Kleiner Tipp:
              Tofu schmeckt am besten, wenn man es kurz vor dem Servieren durch ein saftiges Steak ersetzt...
              1. Ich dachte bisher Computer, besonders Server sind Rudeltiere - oft werde diese sogar in Käfighaltung in Farmen eingesperrt :p

                ich bevorzuge freilaufende

                Ich hätte jetzt eher diesen Freiläufer erwartet.

      2. hi,

        Ich bin im übrigen nicht überzeugt, ob die Ansammlung von Stichworten wirklich ein guter Dateiname ist.
        Die meisten Leute werden die Seiten wohl über die Startseite und Navigation erreichen. Aber man kann ja das ganze von vier auf drei Maximalwörter kürzen etc. Welche Beschränkungen würdest du vorschlagen? Oder allgemeiner: Hast du konkrete Verbesserungsvorschläge?
        Was hälst du von der Idee folgender Definition um Adjektive mit großem Anfangsbuchstaben wie bei "Düsseldorfer Seefest" nicht als "Sinnsubstantiv" zu deklarieren:

        Sinnsubstantiva = Sinnwörter mit großem Anfangsbuchstaben, die nicht vor GENAU EINEM anderen Sinnsubstantiv stehen

        gibt es noch irgendwelche allgemeinen Vorschläge/Ideen? Oder wie würdet ihr derartiges realisieren? Und vor allem: Welche Maximallängen (Wörter, Zeichen) würdet ihr verwenden?

        lghmlh.

        PS: Geschwindigkeit spielt keine Rolle, da das generieren der Dateinamen, das Kopieren in den neuen, anderen Ordner etc. ja nur beim 1. Aufruf nach der Änderung durchgeführt wird und ab dann immer mit der Datei mit dem richtigen Dateinamen im neuen Ordner gearbeitet wird. Und der 1. Aufruf nach der Änderung wird meistens eh vom Webmaster für einen Test (wird die Seite wie erwartet angezeigt) getätigt.