<meta name="robots"> HTML-Attributwert
Der robots Wert für das name Attribut des <meta> Elements (oft als "robots tag" bezeichnet) definiert das Crawling- und Indexierungsverhalten, das Web-Crawler bei der Seite verwenden sollten.
Wenn angegeben, definieren Sie Anweisungen für Crawler im content Attribut des <meta> Elements als kommagetrennte Liste von einer oder mehreren Regeln.
Zum Beispiel kann ein noindex Wert verwendet werden, um den Crawlern anzudeuten, dass eine Seite von deren Suchindizes ausgeschlossen werden soll:
<meta name="robots" content="noindex" />
Hinweis: Nur kooperative Roboter befolgen diese Regeln. Ein Crawler muss dennoch auf die Ressource zugreifen, um Header und Metaelemente zu lesen (siehe X-Robots-Tag: Interaction with robots.txt). Wenn Sie den Bandbreitenverbrauch von Crawlern verhindern möchten, ist eine restriktive robots.txt Datei wirksamer als Indexierungsregeln, da sie Ressourcen vollständig vom Crawling ausschließt.
Verwendungshinweise
Ein <meta name="robots"> Element kann die folgenden zusätzlichen Attribute haben:
content-
Das
contentAttribut muss definiert sein und sein Wert setzt das Indexierungs- und Crawling-Verhalten für kooperative Suchmaschinenroboter fest. Akzeptiert einen oder mehrere der folgenden Schlüsselwörter als kommagetrennte Liste:index-
Erlaubt dem Roboter, die Seite zu indexieren. Dies ist das Standardverhalten. Wird von allen großen Crawlern verwendet.
noindex-
Fordert den Roboter auf, die Seite nicht zu indexieren. Wird von allen großen Crawlern verwendet.
follow-
Erlaubt dem Roboter, Links auf der Seite zu folgen. Dies ist das Standardverhalten. Wird von allen großen Crawlern verwendet.
nofollow-
Fordert den Roboter auf, den Links auf der Seite nicht zu folgen. Wird von allen großen Crawlern verwendet.
all-
Entspricht
index, follow. Verwendet von: Google. none-
Entspricht
noindex, nofollow. Verwendet von: Google. noarchive-
Fordert, dass die Suchmaschine den Seiteninhalt nicht cached. Verwendet von: Google, Yahoo, Bing.
nosnippet-
Verhindert die Anzeige einer Beschreibung der Seite in den Suchmaschinenergebnissen. Verwendet von: Google, Bing.
noimageindex-
Fordert, dass diese Seite nicht als Verweisseite eines indizierten Bildes erscheint. Verwendet von: Google.
nocache-
Synonym von
noarchive. Verwendet von: Bing.
Beschreibung
Es gibt mehrere wichtige Überlegungen, die beim Setzen eines robots Meta-Wertes zu beachten sind:
- Nur kooperative Roboter befolgen diese Regeln. Sie verhindern nicht, dass böswillige Akteure, wie E-Mail-Ernteprogramme, die Anweisungen ignorieren.
- Wenn sie in einem
<meta>Tag definiert sind, müssen Roboter dennoch auf die Seite zugreifen, um diese Regeln zu lesen. Um den Bandbreitenverbrauch zu reduzieren, sollten Sie stattdessen die Verwendung einer robots.txt Datei in Betracht ziehen. - Der
<meta name="robots">Tag undrobots.txthaben unterschiedliche Rollen:robots.txtsteuert das Crawling, während dasrobotsMeta-Tag die Indexierung und anderes Verhalten beeinflusst. - Eine Seite, die durch
robots.txtblockiert ist, kann dennoch indiziert werden, wenn sie von anderen Quellen verlinkt wird. - Die
noindexAnweisung wird erst wirksam, nachdem der Roboter die Seite erneut besucht hat, stellen Sie also sicher, dassrobots.txtdies nicht verhindert. - Einige Werte, wie
indexvs.noindexoderfollowvs.nofollow, schließen sich gegenseitig aus. Das Verhalten ist undefiniert, wenn widersprüchliche Werte verwendet werden. - Roboter wie Google, Yahoo und Bing unterstützen diese Anweisungen auch im HTTP-Header
X-Robots-Tag, was für nicht-HTML-Inhalte wie PDFs oder Bilder nützlich ist.
Beispiele
>Verwendung eines Robots-Schlüsselworts
Das folgende Beispiel verwendet nofollow, um zu verlangen, dass ein Crawler keine Links auf einer Seite verfolgt, und noindex, um zu verlangen, dass die Seite von der Indexierung ausgeschlossen wird:
<meta name="robots" content="nofollow, noindex" />
Spezifikationen
Obwohl es nicht Teil irgendeiner Spezifikation ist, ist es eine De-facto-Standardmethode zur Kommunikation mit Such-Bots, Web-Crawlern und ähnlichen Benutzeragenten.
Browser-Kompatibilität
Dieses Feature ist für Crawler gedacht, daher ist "Browser-Kompatibilität" nicht anwendbar.
Siehe auch
- HTTP-Header
X-Robots-Tag - robots.txt Konfiguration Leitfaden
- robots.txt Glossareintrag
- Suchmaschine Glossareintrag
- RFC 9309: Robots Exclusion Protocol
- WHATWG Wiki MetaExtensions Seite
- Verwendung des robots Meta-Tags auf developers.google.com