rudi: robtos.txt muss man auch bilderordner intergrieren?

Hallo,
wie ist das mit der robots.txt Datei?
Ich habe mir den Artikel in Self HTML durchgelesen, kapiere trotzdem nicht alles.
Muss man Bilderordner auch ausschließen?
Hat irgendwer gute Beispiel robots.txt Dateien?

Danke schonmal.

  1. Halihallo rudi

    Muss man Bilderordner auch ausschließen?

    Die Frage ist, ob _du_ den Bilderordnet ausschliessen möchtest. Willst du die
    Bilderordner indizieren, dann nicht ausschliessen, willst du sie nicht indizieren lassen,
    schliesse sie aus.
    Die robots.txt sagt dem Roboter nur, ob und welche Ressourcen er indizieren soll. Es ist
    allein _deine_ Aufgabe zu sagen, was für den Roboter (Suchmaschine) relevant sein könnte.
    Ob du deine Bilder als relevant einstufen willst, ist deine Entscheidung.

    Fakt ist, dass Bilder wie auch HTML-Dokumente Ressourcen sind und robots.txt definiert
    die Verarbeitungsweise solcher; Fakt ist auch, dass viele Suchmaschinen die Bilder
    per Definition nicht indizieren, da sie dieses Medium nicht erfassen.

    Viele Grüsse

    Philipp

    1. Moin!

      Die robots.txt sagt dem Roboter nur, ob und welche Ressourcen er indizieren soll.

      Genau anders herum ist es richtig: Die robots.txt sagt dem Spider (und nur denen, die danach fragen - niemand wird daran gehindert, unfreundliche Spider zu schreiben, die sich nicht dran halten), auf welche Verzeichnisse er nicht zugreifen und sie somit nicht indizieren soll.

      Es ist nicht möglich, in der robots.txt Angaben zu machen, welche Verzeichnisse _doch_ indiziert werden sollen, weil eben nur "Disallow" vorgesehen ist, nicht "Allow".

      - Sven Rautenberg

      --
      "Bei einer Geschichte gibt es immer vier Seiten: Deine Seite, ihre Seite, die Wahrheit und das, was wirklich passiert ist." (Rousseau)
      1. Auch Moin!

        Es ist nicht möglich, in der robots.txt Angaben zu machen, welche Verzeichnisse _doch_ indiziert werden sollen, weil eben nur "Disallow" vorgesehen ist, nicht "Allow".

        Wobei man hier erwaehnen sollte, dass an einigen Stellen im Web - ich glaube auch in Selfhtml - die Moeglichkeit eines Allow genannt wird. Das bedeutet aber nicht, dass Du voellig debil bist *g*, sondern dass diese Moeglichkeit bisher nirgendwo standardisiert ist.[1] Es gibt lediglich einen Internet-Draft, in dem das Allow behandelt wird.

        [1] Genaugenommen ist die robots.txt ueberhaupt nicht standardisiert. Es gibt aber einen "Konsens" darueber, der bis heute allgemein anerkannt ist: http://www.robotstxt.org/wc/norobots.html.

        So long

        --
        Your password must be at least 18770 characters and cannot repeat any of your previous 30689 passwords.
            -- http://support.microsoft.com/default.aspx?scid=kb;en-us;Q276304