TSO: Unterschied zwischen noindex und noarchive

Beitrag lesen

Letzteres, also „und“, da die Seite offensichtlich weder indiziert, noch archiviert werden soll. Allerdings stellt das nicht sicher, dass die Seite aus allen Suchmaschinen gelöscht wird. Einerseits sind diese Angaben kein MUSS, andererseits gibt es zusätzliche Techniken und Vorgehensweisen, um die Erfüllung dieses Wunsches sicher zu stellen.

Da wäre die robots.txt (Folgeleistung ebenfalls optional),

Da muss man wohl vorsichtig sein: Ich habe mal gelesen, dass es da merkwürdige Seiteneffekte geben kann.

So soll angeblich eine Aufnahme einer Seite in die robots.txt nicht verhindern, dass eine bereits im Index vorhandene Seite auch daraus verschwindet. Im Gegenteil: Ein in den Header der Seite eingefügtes <meta name="robots" content="noindex"> wird von der Suchmaschine ebenfalls nicht berücksichtigt, weil sie sich an die Angabe in der robots.txt hält und die Seite nicht mehr abruft. Als Konsequenz bleibt die Seite im Index (und ggf. im Cache), aber in alter Version.