noindex: Wie du Seiten sauber aus dem Google-Index nimmst

Auf einen Blick

noindex regelt die Indexierung, nicht das Crawling: Google muss die Seite weiter abrufen können, um den Tag überhaupt zu lesen.
noindex in der robots.txt ist seit dem 1. September 2019 wirkungslos (Google Search Central Blog, 2019), nur Meta-Tag oder X-Robots-Tag-Header zählen.
noindex plus Disallow ist ein Widerspruch: der gesperrte Bot liest den noindex nie, die URL kann als snippetloser Eintrag hängen bleiben.
Bei JavaScript-Seiten gehört der noindex serverseitig ins initiale HTML, nicht erst clientseitig in den gerenderten DOM.
Eine dauerhaft per noindex ausgeschlossene Seite verliert über die Zeit ihre Fähigkeit, Link-Equity weiterzugeben, ein Backlink darauf ist verbranntes Budget.
Der Bericht « Durch noindex-Tag ausgeschlossen » ist nur dann ein Problem, wenn eine Seite gelistet wird, die eigentlich ranken soll.

3 Fragen, um Ihr Wissen zu prüfen

Erst lesen — das Quiz wartet am Seitenende.

Was noindex im Betrieb wirklich bedeutet

Wer eine Seite aus dem Index nehmen will, greift zum noindex, und genau hier passieren die teuersten Fehler. Der noindex ist keine höfliche Bitte an die Suchmaschine, sondern eine direkte Anweisung: Diese Seite darf nicht in den Ergebnissen erscheinen. Entscheidend ist die Trennung, die Tutorials gern übergehen: noindex steuert die Indexierung, nicht das Crawling. Google muss die Seite weiterhin abrufen können, um den Tag überhaupt zu lesen.

In der Praxis heißt das: ein noindex wirkt erst, wenn der Bot die Seite erneut crawlt und die Direktive sieht. Bei selten besuchten URLs kann das Tage bis Wochen dauern. Wer erwartet, dass eine Seite über Nacht aus den Ergebnissen verschwindet, hat den Mechanismus missverstanden. noindex ist ein Prozess über mehrere Crawls hinweg, kein Schalter, den man umlegt.

Und er gehört in den strategischen Werkzeugkasten, nicht nur in die technische Hygiene. Welche Seiten ein Bot indexiert, beeinflusst, wie eine Domain ihr Crawl-Budget und ihre interne Linkkraft verteilt. Auf einer gewachsenen Site entscheidet die Disziplin beim noindex mit darüber, ob die kommerziell relevanten Seiten die Aufmerksamkeit bekommen, statt sie an dünne Filter-URLs und interne Suchergebnisse zu verlieren.

Wie der noindex-Tag 2026 technisch funktioniert

Es gibt genau zwei seriöse Wege, einen noindex auszuliefern. Erstens das Meta-Tag im Kopf des Dokuments: <meta name="robots" content="noindex"> im <head>. Zweitens der HTTP-Response-Header X-Robots-Tag: noindex, der sich auch auf Ressourcen ohne <head> anwenden lässt, etwa PDFs oder Bilder. Beide tragen dieselbe Instruktion, nur der Transportweg unterscheidet sich. Der Header ist die robustere Variante, weil er serverseitig sitzt und vom Rendering unabhängig ist.

Der dritte Weg, der durch ältere Foren geistert, ist tot: noindex in der robots.txt. Google hat im Juli 2019 angekündigt, diese nie offizielle Direktive ab dem 1. September 2019 nicht mehr zu unterstützen (Google Search Central Blog, 2019). Wer heute Noindex: /pfad/ in die robots.txt schreibt, erzeugt eine wirkungslose Zeile. Die robots.txt regelt über Disallow das Crawling, nicht die Indexierung, das sind zwei verschiedene Ebenen.

Wichtig ist der Standardwert: fehlt jede Direktive, behandelt Google die Seite als index, follow. noindex muss man aktiv setzen. Kombinieren lässt er sich mit nofollow, also <meta name="robots" content="noindex, nofollow">, was den Bot anweist, weder die Seite zu indexieren noch ihren Links zu folgen. In den meisten Fällen ist diese Kombination ein Fehler, weil sie der Seite auch die Fähigkeit nimmt, interne Linkkraft weiterzureichen.

Messen lässt sich der Status am direktesten über die URL-Prüfung der Search Console und über einen schlichten Server-Request, der den X-Robots-Tag-Header oder den gerenderten <head> zeigt. Verlasse dich nie auf « Seitenquelltext anzeigen » im Browser allein: bei JavaScript-Seiten steht im initialen HTML oft etwas anderes als im gerenderten DOM.

noindex, disallow, 404 und 410 auseinanderhalten

Die häufigste konzeptionelle Verwirrung im Audit betrifft vier Werkzeuge, die alle irgendwie « eine Seite loswerden », aber völlig verschieden wirken. Wer sie verwechselt, produziert genau die Indexierungsprobleme, die er beheben wollte. Kein Wettbewerber im deutschsprachigen Top-10 stellt diesen Vergleich sauber dar, also lohnt sich die Präzision.

Ein Disallow in der robots.txt ist das Gegenstück zum noindex, kein Synonym. Es verbietet das Crawling, garantiert aber keine Deindexierung. Eine gesperrte URL, auf die extern verlinkt wird, kann ohne Snippet im Index auftauchen, mit dem Hinweis, dass keine Beschreibung verfügbar ist. Will man eine Seite zuverlässig aus dem Index halten, ist Disallow das falsche Werkzeug, weil der Bot den noindex hinter der Sperre nie zu sehen bekommt.

404 und 410 spielen in einer anderen Liga. Sie löschen nicht den Indexeintrag einer bestehenden, erreichbaren Seite, sondern signalisieren, dass die Ressource weg ist. 410 (Gone) wird von Google tendenziell schneller als endgültig verarbeitet als 404 (Not Found), der eine vorübergehende Störung sein könnte. Für eine Seite, die erreichbar bleiben, aber nicht ranken soll, sind beide falsch. Die Faustregel aus dem Audit: noindex für « bleibt online, raus aus dem Index », 410 für « existiert nicht mehr ».

noindex in CMS, Shopify und JavaScript-Seiten

In gängigen CMS ist der noindex selten Handarbeit. In WordPress setzt der Schalter « Suchmaschinen davon abhalten, diese Website zu indexieren » einen globalen noindex über die gesamte Site, ein Schalter, der nach einem Launch erschreckend oft aktiviert bleibt. Auf Seitenebene erledigen Yoast SEO und Rank Math das per Toggle pro Beitrag oder Vorlage, TYPO3 über die Seiteneigenschaften. Das Prinzip bleibt identisch, das Plugin schreibt am Ende nur das Meta-Tag oder den Header.

Speziell für Shopify-Händler zeigt das folgende Video, wie der noindex-Tag korrekt gesetzt wird, ohne in die theme.liquid-Logik einzugreifen:

Der unterschätzte Fall sind JavaScript-gerenderte Seiten und Single-Page-Apps. Wird der noindex erst clientseitig per JavaScript in den DOM injiziert, muss Google die Seite rendern, um ihn zu sehen, und dieses Rendering passiert in einer zweiten, verzögerten Welle. Bis dahin kann die Seite längst indexiert sein. Schlimmer noch: liefert das initiale HTML index und das gerenderte DOM noindex, gewinnt nicht zuverlässig die spätere Anweisung. Aus eigener Audit-Erfahrung gilt die klare Regel: setze den noindex serverseitig, im initialen HTML oder über den X-Robots-Tag-Header, nie ausschließlich clientseitig.

Häufige Fehler und der Search-Console-Bericht

Der teuerste Klassiker ist der vergessene Staging-noindex. Eine Testumgebung läuft korrekt mit globalem noindex, beim Go-live wandert das Setting unbemerkt auf die Produktion, und wochenlang fragt sich das Team, warum nichts rankt. Direkt dahinter: versehentlich mit noindex versehene Startseiten oder ein Impressum, das jemand pauschal ausgeschlossen hat. Ein Impressum darf in Deutschland aus Compliance-Sicht durchaus indexiert sein, ein noindex darauf ist meist ein Missverständnis, kein Rechtsgebot.

Der Bericht « Durch das noindex-Tag ausgeschlossen » in der Search Console ist nicht automatisch ein Alarm. Er wird erst zum Problem, wenn dort eine Seite auftaucht, die eigentlich Sichtbarkeit braucht. Das folgende Video zeigt Schritt für Schritt, wie man diesen Fall in der Console analysiert und behebt:

Bei WordPress-Setups mit Elementor schleicht sich der noindex oft über Theme- oder Builder-Einstellungen ein, die unabhängig vom SEO-Plugin greifen. Diese Demonstration zeigt, wie man die Indexierung dort wiederherstellt:

Was im Audit großer Sites zusätzlich fehlt: niemand prüft die bestehenden noindex-Tags systematisch. Sinnvoll ist ein Crawl mit einem Tool wie Screaming Frog oder Sitebulb, gefiltert auf die Indexierbarkeit, abgeglichen mit der Liste der URLs, die laut Strategie ranken sollen. Erst dieser Abgleich deckt die Seiten auf, die irrtümlich ausgeschlossen sind, und genauso die dünnen Seiten, die längst einen noindex tragen sollten.

noindex, Link-Equity und die Netlinking-Folge

Hier wird der noindex für jeden relevant, der mit Linkaufbau arbeitet, und hier ist die Quellenlage dünn. Solange eine noindex-Seite weiter gecrawlt wird, kann sie über ihre ausgehenden Links zunächst Equity weitergeben. Auf lange Sicht behandelt Google eine dauerhaft ausgeschlossene Seite jedoch zunehmend wie noindex, nofollow: ihre Links verlieren mit der Zeit an Wirkung (John Mueller, Google, in mehreren Office-Hours-Sessions). Eine noindex-Seite mitten in der internen Verlinkung ist damit ein langsames Leck.

Für den Linkkauf folgt daraus eine harte Regel: prüfe vor dem Kauf, ob die aufnehmende Seite indexierbar ist. Ein redaktioneller Link auf einer noindex-Seite ist verbranntes Budget, die Seite kann nicht ranken und gibt langfristig nichts weiter. Genau hier liegt der praktische Wert von Transparenz statt Blackbox: Wer einen Backlink direkt bei der aufnehmenden Redaktion platziert, sieht den Indexierungsstatus der Zielseite vorab. Bei Stringer Network arbeiten wir deshalb mit einem frei einsehbaren Medienkatalog, ohne Zwischenhändler und ohne dass man auf gut Glück in eine noindex-Falle kauft.

Auch in die Gegenrichtung lohnt der Blick: zielt eine eingekaufte Verlinkung auf eine eigene Seite, die intern auf noindex steht, läuft die ganze Kampagne ins Leere. Vor jeder Velocity-Planung gehört also ein Indexierbarkeits-Check der Zielseiten. Und für doppelte Inhalte ist der noindex oft das gröbere Werkzeug: wo Varianten konsolidiert und ihre Signale gebündelt werden sollen, ist der Canonical-Tag die elegantere Wahl, weil er die Linkkraft umleitet, statt sie zu kappen. noindex nimmt eine Seite aus dem Spiel, Canonical hält sie im Spiel und verweist auf das Original.

Häufige Fragen

Was ist der Unterschied zwischen noindex und einem Disallow in der robots.txt?

noindex erlaubt das Crawling, verbietet aber die Indexierung: Google muss die Seite abrufen, um die Anweisung zu lesen. Disallow verbietet das Crawling, garantiert aber keine Deindexierung. Eine per Disallow gesperrte und extern verlinkte URL kann snippetlos im Index landen. Wer eine Seite zuverlässig aus dem Index halten will, nutzt noindex und lässt die URL crawlbar, statt sie zusätzlich per robots.txt zu sperren.

Funktioniert noindex in der robots.txt noch?

Nein. Google hat im Juli 2019 angekündigt, die inoffizielle Noindex-Direktive in der robots.txt ab dem 1. September 2019 nicht mehr zu unterstützen (Google Search Central Blog, 2019). Eine solche Zeile ist heute wirkungslos. Gültig sind nur das Meta-Robots-Tag im <head> und der X-Robots-Tag-HTTP-Header. Letzterer ist die robustere Wahl, weil er serverseitig sitzt und auch für Nicht-HTML-Ressourcen wie PDFs greift.

Sollte das Impressum auf noindex stehen?

In der Regel nicht. Ein noindex auf dem Impressum ist meist ein Missverständnis, kein rechtliches Gebot. Die Impressumspflicht in Deutschland verlangt Erreichbarkeit und Sichtbarkeit für Nutzer, nicht den Ausschluss aus dem Suchindex. Ein indexiertes Impressum schadet dem Ranking der eigentlichen Geld-Seiten nicht. Der pauschale noindex auf rechtlichen Seiten entsteht oft durch ein globales CMS-Setting, das niemand bewusst gesetzt hat.

Gibt eine noindex-Seite noch Link-Equity weiter?

Kurzfristig kann sie das, solange sie gecrawlt wird. Langfristig behandelt Google eine dauerhaft ausgeschlossene Seite jedoch zunehmend wie noindex, nofollow, ihre Links verlieren also an Wirkung. Für die Praxis heißt das: verlasse dich nicht auf eine noindex-Seite als Knoten in der internen Verlinkung. Und kaufe keinen Backlink, der auf einer noindex-Seite sitzt oder auf eine eigene noindex-Zielseite zeigt, das Budget verpufft.

Wie behebt man den Search-Console-Hinweis « Durch noindex-Tag ausgeschlossen »?

Zuerst prüfen, ob der Ausschluss gewollt ist: bei dünnen Seiten oder Filter-URLs ist er korrekt. Soll die Seite ranken, das noindex-Tag in der Quelle finden, im Meta-Robots, im X-Robots-Header oder im CMS- bzw. Builder-Setting wie Yoast, Rank Math oder Elementor. Tag entfernen, mit der URL-Prüfung neu rendern lassen, Indexierung beantragen. Bei JS-Seiten den gerenderten DOM kontrollieren, nicht nur den Quelltext.

noindex oder 410 für eine Seite, die verschwinden soll?

Das hängt davon ab, ob die Seite erreichbar bleibt. Soll sie online bleiben, aber nicht ranken, etwa interne Suchergebnisse oder Paginierungsseiten, dann noindex. Soll die Ressource endgültig weg sein, dann 410 (Gone), das Google schneller als final verarbeitet als ein 404 (Not Found). Ein noindex auf einer Seite, die du eigentlich löschen willst, hält sie unnötig im Crawl-Budget.

Quiz

Prüfen Sie Ihr Wissen

Quiz: noindex

1/3

Warum ist die Kombination aus noindex im <head> und Disallow für dieselbe URL in der robots.txt problematisch?

Benoit Demonchaux

Gründer und Betreiber von Stringer Network. Redigiert und schreibt das redaktionelle Glossar der Website sowie die Inhalte, die im Stringer-Netzwerk redaktioneller Medien veröffentlicht werden.