Beachte: Google fordert das Tool zur Entfernung nicht zu missbrauchen4 und nur bei unbedingt notwendiger Entfernung anzuwenden. Bei indexierten Webpages, die beispielsweise einen doppelten Inhalt enthalten, empfiehlt Google eine der Seiten als Duplikat zu kennzeichnen.5
Damit die Suchmaschinen die URL dauerhaft aus den Suchergebnissen ausblenden oder bereits indexierte URLs nach einiger Zeit selbständig aus den Suchergebnisseiten entfernen, muss den Suchmaschinen-Crawlern mitgeteilt werden, dass die Webpage nicht im Index bzw. in den Suchergebnisseiten aufgenommen werden soll:
Hierfür muss im <head>
-Bereich der Webpage die Angabe <meta name="robots" content="noindex">
eingefügt werden:
<head>
<!-- …-->
<meta name="robots" content="noindex">
<!-- …-->
</head>
Hinweis: Der Einsatz der Text-Datei robots.txt ist nicht geeignet, um Webpages aus dem Index fernzuhalten. Hierbei wird die darin angegebene Webpage zwar nicht gecrawlt, aber indexiert, wenn ein Backlink zur Webpage von Google gefunden wurde. Entferne daher die Einträge in der Text-Datei robots.txt, die verhindern, dass die aus dem Index fernzuhaltende Webpage nicht gecrawlt werden soll, da sonst dir obige Angabe nicht vom Crawler ausgelesen und damit nicht berücksichtigt werden kann.
WordPress
In WordPress erscheint die Angabe <meta name="robots" content="noindex">
automatisch im Kopfbereich aller hiermit erzeugten Webpages, wenn im Bereich Einstellungen › Lesen, die Suchmaschine davon abgehalten wurde, die Website zu indexieren:
Sollen hingegen nur einzelne Seiten (z.B. Anhangseiten oder Seiten mit dem Titel Weihnachten und Silvester) aus dem Index entfernt werden, kann folgender Codeschnipsel in die Datei functions.php des Child-Themes oder in ein seitenspezifisches Plugin eingefügt werden:
function add_meta_robots_noindex_follow() {
if ( is_attachment() || is_page( array( 'Silvester', 'Weihnachten' ) ) ) {
wp_no_robots();
}
}
add_action( 'wp_head', 'add_meta_robots_noindex_follow' );
Erklärung: Die WordPress-Funktion wp_no_robots()
6 gibt <meta name="robots" content="noindex">
im Quelltext aus.
Ist bei der Erstellung eines Beitrages bereits klar, dass dieser ab einem bestimmten Datum von Google nicht mehr indexiert sein soll, kann dem Crawler diese Information7 im Head-Bereich der Seite wie folgt ausgegeben werden:
function add_meta_unavailable_after(){
if ( is_single( 'tag-der-offenen-tuer-10-01-2018' ) ) {
echo '<meta name="googlebot" content="unavailable_after: 10-Jan-2018 20:00:00 EST">'; }
}
add_action( 'wp_head', 'add_meta_unavailable_after' );
Erklärung: Passe hier das gewünschte Datum im Meta-Element ("unavailable_after: 10-Jan-2018 20:00:00 EST"
), die Titelform des Eintrages ('tag-der-offenen-tuer-10-01-2018'
) und in der if-Anweisung den Conditional Tag für das Post Type des Eintrages (bei Beiträgen is_single()
, bei Seiten is_page()
, bei WooCommerce-Produkten is_product()
[uws]) an. Füge anschließend den Codeschnipsel in die Datei functions.php des Child-Themes oder in ein seitenspezifisches Plugin.
wp_no_robots()
: