Dieser Inhalt wurde automatisch aus dem Englischen übersetzt, und kann Fehler enthalten. Erfahre mehr über dieses Experiment.

View in English Always switch to English

<meta name="robots"> HTML-Attributwert

Der robots Wert für das name Attribut des <meta> Elements (oft als "robots tag" bezeichnet) definiert das Crawling- und Indexierungsverhalten, das Web-Crawler bei der Seite verwenden sollten. Wenn angegeben, definieren Sie Anweisungen für Crawler im content Attribut des <meta> Elements als kommagetrennte Liste von einer oder mehreren Regeln.

Zum Beispiel kann ein noindex Wert verwendet werden, um den Crawlern anzudeuten, dass eine Seite von deren Suchindizes ausgeschlossen werden soll:

html
<meta name="robots" content="noindex" />

Hinweis: Nur kooperative Roboter befolgen diese Regeln. Ein Crawler muss dennoch auf die Ressource zugreifen, um Header und Metaelemente zu lesen (siehe X-Robots-Tag: Interaction with robots.txt). Wenn Sie den Bandbreitenverbrauch von Crawlern verhindern möchten, ist eine restriktive robots.txt Datei wirksamer als Indexierungsregeln, da sie Ressourcen vollständig vom Crawling ausschließt.

Verwendungshinweise

Ein <meta name="robots"> Element kann die folgenden zusätzlichen Attribute haben:

content

Das content Attribut muss definiert sein und sein Wert setzt das Indexierungs- und Crawling-Verhalten für kooperative Suchmaschinenroboter fest. Akzeptiert einen oder mehrere der folgenden Schlüsselwörter als kommagetrennte Liste:

index

Erlaubt dem Roboter, die Seite zu indexieren. Dies ist das Standardverhalten. Wird von allen großen Crawlern verwendet.

noindex

Fordert den Roboter auf, die Seite nicht zu indexieren. Wird von allen großen Crawlern verwendet.

follow

Erlaubt dem Roboter, Links auf der Seite zu folgen. Dies ist das Standardverhalten. Wird von allen großen Crawlern verwendet.

nofollow

Fordert den Roboter auf, den Links auf der Seite nicht zu folgen. Wird von allen großen Crawlern verwendet.

all

Entspricht index, follow. Verwendet von: Google.

none

Entspricht noindex, nofollow. Verwendet von: Google.

noarchive

Fordert, dass die Suchmaschine den Seiteninhalt nicht cached. Verwendet von: Google, Yahoo, Bing.

nosnippet

Verhindert die Anzeige einer Beschreibung der Seite in den Suchmaschinenergebnissen. Verwendet von: Google, Bing.

noimageindex

Fordert, dass diese Seite nicht als Verweisseite eines indizierten Bildes erscheint. Verwendet von: Google.

nocache

Synonym von noarchive. Verwendet von: Bing.

Beschreibung

Es gibt mehrere wichtige Überlegungen, die beim Setzen eines robots Meta-Wertes zu beachten sind:

  • Nur kooperative Roboter befolgen diese Regeln. Sie verhindern nicht, dass böswillige Akteure, wie E-Mail-Ernteprogramme, die Anweisungen ignorieren.
  • Wenn sie in einem <meta> Tag definiert sind, müssen Roboter dennoch auf die Seite zugreifen, um diese Regeln zu lesen. Um den Bandbreitenverbrauch zu reduzieren, sollten Sie stattdessen die Verwendung einer robots.txt Datei in Betracht ziehen.
  • Der <meta name="robots"> Tag und robots.txt haben unterschiedliche Rollen: robots.txt steuert das Crawling, während das robots Meta-Tag die Indexierung und anderes Verhalten beeinflusst.
  • Eine Seite, die durch robots.txt blockiert ist, kann dennoch indiziert werden, wenn sie von anderen Quellen verlinkt wird.
  • Die noindex Anweisung wird erst wirksam, nachdem der Roboter die Seite erneut besucht hat, stellen Sie also sicher, dass robots.txt dies nicht verhindert.
  • Einige Werte, wie index vs. noindex oder follow vs. nofollow, schließen sich gegenseitig aus. Das Verhalten ist undefiniert, wenn widersprüchliche Werte verwendet werden.
  • Roboter wie Google, Yahoo und Bing unterstützen diese Anweisungen auch im HTTP-Header X-Robots-Tag, was für nicht-HTML-Inhalte wie PDFs oder Bilder nützlich ist.

Beispiele

Verwendung eines Robots-Schlüsselworts

Das folgende Beispiel verwendet nofollow, um zu verlangen, dass ein Crawler keine Links auf einer Seite verfolgt, und noindex, um zu verlangen, dass die Seite von der Indexierung ausgeschlossen wird:

html
<meta name="robots" content="nofollow, noindex" />

Spezifikationen

Obwohl es nicht Teil irgendeiner Spezifikation ist, ist es eine De-facto-Standardmethode zur Kommunikation mit Such-Bots, Web-Crawlern und ähnlichen Benutzeragenten.

Browser-Kompatibilität

Dieses Feature ist für Crawler gedacht, daher ist "Browser-Kompatibilität" nicht anwendbar.

Siehe auch