Was noindex im Betrieb wirklich bedeutet
Wer eine Seite aus dem Index nehmen will, greift zum noindex, und genau hier passieren die teuersten Fehler. Der noindex ist keine höfliche Bitte an die Suchmaschine, sondern eine direkte Anweisung: Diese Seite darf nicht in den Ergebnissen erscheinen. Entscheidend ist die Trennung, die Tutorials gern übergehen: noindex steuert die Indexierung, nicht das Crawling. Google muss die Seite weiterhin abrufen können, um den Tag überhaupt zu lesen.
In der Praxis heißt das: ein noindex wirkt erst, wenn der Bot die Seite erneut crawlt und die Direktive sieht. Bei selten besuchten URLs kann das Tage bis Wochen dauern. Wer erwartet, dass eine Seite über Nacht aus den Ergebnissen verschwindet, hat den Mechanismus missverstanden. noindex ist ein Prozess über mehrere Crawls hinweg, kein Schalter, den man umlegt.
Und er gehört in den strategischen Werkzeugkasten, nicht nur in die technische Hygiene. Welche Seiten ein Bot indexiert, beeinflusst, wie eine Domain ihr Crawl-Budget und ihre interne Linkkraft verteilt. Auf einer gewachsenen Site entscheidet die Disziplin beim noindex mit darüber, ob die kommerziell relevanten Seiten die Aufmerksamkeit bekommen, statt sie an dünne Filter-URLs und interne Suchergebnisse zu verlieren.
Wie der noindex-Tag 2026 technisch funktioniert
Es gibt genau zwei seriöse Wege, einen noindex auszuliefern. Erstens das Meta-Tag im Kopf des Dokuments: <meta name="robots" content="noindex"> im <head>. Zweitens der HTTP-Response-Header X-Robots-Tag: noindex, der sich auch auf Ressourcen ohne <head> anwenden lässt, etwa PDFs oder Bilder. Beide tragen dieselbe Instruktion, nur der Transportweg unterscheidet sich. Der Header ist die robustere Variante, weil er serverseitig sitzt und vom Rendering unabhängig ist.
Der dritte Weg, der durch ältere Foren geistert, ist tot: noindex in der robots.txt. Google hat im Juli 2019 angekündigt, diese nie offizielle Direktive ab dem 1. September 2019 nicht mehr zu unterstützen (Google Search Central Blog, 2019). Wer heute Noindex: /pfad/ in die robots.txt schreibt, erzeugt eine wirkungslose Zeile. Die robots.txt regelt über Disallow das Crawling, nicht die Indexierung, das sind zwei verschiedene Ebenen.
Wichtig ist der Standardwert: fehlt jede Direktive, behandelt Google die Seite als index, follow. noindex muss man aktiv setzen. Kombinieren lässt er sich mit nofollow, also <meta name="robots" content="noindex, nofollow">, was den Bot anweist, weder die Seite zu indexieren noch ihren Links zu folgen. In den meisten Fällen ist diese Kombination ein Fehler, weil sie der Seite auch die Fähigkeit nimmt, interne Linkkraft weiterzureichen.
Messen lässt sich der Status am direktesten über die URL-Prüfung der Search Console und über einen schlichten Server-Request, der den X-Robots-Tag-Header oder den gerenderten <head> zeigt. Verlasse dich nie auf « Seitenquelltext anzeigen » im Browser allein: bei JavaScript-Seiten steht im initialen HTML oft etwas anderes als im gerenderten DOM.
noindex, disallow, 404 und 410 auseinanderhalten
Die häufigste konzeptionelle Verwirrung im Audit betrifft vier Werkzeuge, die alle irgendwie « eine Seite loswerden », aber völlig verschieden wirken. Wer sie verwechselt, produziert genau die Indexierungsprobleme, die er beheben wollte. Kein Wettbewerber im deutschsprachigen Top-10 stellt diesen Vergleich sauber dar, also lohnt sich die Präzision.
Ein Disallow in der robots.txt ist das Gegenstück zum noindex, kein Synonym. Es verbietet das Crawling, garantiert aber keine Deindexierung. Eine gesperrte URL, auf die extern verlinkt wird, kann ohne Snippet im Index auftauchen, mit dem Hinweis, dass keine Beschreibung verfügbar ist. Will man eine Seite zuverlässig aus dem Index halten, ist Disallow das falsche Werkzeug, weil der Bot den noindex hinter der Sperre nie zu sehen bekommt.
404 und 410 spielen in einer anderen Liga. Sie löschen nicht den Indexeintrag einer bestehenden, erreichbaren Seite, sondern signalisieren, dass die Ressource weg ist. 410 (Gone) wird von Google tendenziell schneller als endgültig verarbeitet als 404 (Not Found), der eine vorübergehende Störung sein könnte. Für eine Seite, die erreichbar bleiben, aber nicht ranken soll, sind beide falsch. Die Faustregel aus dem Audit: noindex für « bleibt online, raus aus dem Index », 410 für « existiert nicht mehr ».
noindex in CMS, Shopify und JavaScript-Seiten
In gängigen CMS ist der noindex selten Handarbeit. In WordPress setzt der Schalter « Suchmaschinen davon abhalten, diese Website zu indexieren » einen globalen noindex über die gesamte Site, ein Schalter, der nach einem Launch erschreckend oft aktiviert bleibt. Auf Seitenebene erledigen Yoast SEO und Rank Math das per Toggle pro Beitrag oder Vorlage, TYPO3 über die Seiteneigenschaften. Das Prinzip bleibt identisch, das Plugin schreibt am Ende nur das Meta-Tag oder den Header.
Speziell für Shopify-Händler zeigt das folgende Video, wie der noindex-Tag korrekt gesetzt wird, ohne in die theme.liquid-Logik einzugreifen:
Der unterschätzte Fall sind JavaScript-gerenderte Seiten und Single-Page-Apps. Wird der noindex erst clientseitig per JavaScript in den DOM injiziert, muss Google die Seite rendern, um ihn zu sehen, und dieses Rendering passiert in einer zweiten, verzögerten Welle. Bis dahin kann die Seite längst indexiert sein. Schlimmer noch: liefert das initiale HTML index und das gerenderte DOM noindex, gewinnt nicht zuverlässig die spätere Anweisung. Aus eigener Audit-Erfahrung gilt die klare Regel: setze den noindex serverseitig, im initialen HTML oder über den X-Robots-Tag-Header, nie ausschließlich clientseitig.
Häufige Fehler und der Search-Console-Bericht
Der teuerste Klassiker ist der vergessene Staging-noindex. Eine Testumgebung läuft korrekt mit globalem noindex, beim Go-live wandert das Setting unbemerkt auf die Produktion, und wochenlang fragt sich das Team, warum nichts rankt. Direkt dahinter: versehentlich mit noindex versehene Startseiten oder ein Impressum, das jemand pauschal ausgeschlossen hat. Ein Impressum darf in Deutschland aus Compliance-Sicht durchaus indexiert sein, ein noindex darauf ist meist ein Missverständnis, kein Rechtsgebot.
Der Bericht « Durch das noindex-Tag ausgeschlossen » in der Search Console ist nicht automatisch ein Alarm. Er wird erst zum Problem, wenn dort eine Seite auftaucht, die eigentlich Sichtbarkeit braucht. Das folgende Video zeigt Schritt für Schritt, wie man diesen Fall in der Console analysiert und behebt:
Bei WordPress-Setups mit Elementor schleicht sich der noindex oft über Theme- oder Builder-Einstellungen ein, die unabhängig vom SEO-Plugin greifen. Diese Demonstration zeigt, wie man die Indexierung dort wiederherstellt:
Was im Audit großer Sites zusätzlich fehlt: niemand prüft die bestehenden noindex-Tags systematisch. Sinnvoll ist ein Crawl mit einem Tool wie Screaming Frog oder Sitebulb, gefiltert auf die Indexierbarkeit, abgeglichen mit der Liste der URLs, die laut Strategie ranken sollen. Erst dieser Abgleich deckt die Seiten auf, die irrtümlich ausgeschlossen sind, und genauso die dünnen Seiten, die längst einen noindex tragen sollten.
noindex, Link-Equity und die Netlinking-Folge
Hier wird der noindex für jeden relevant, der mit Linkaufbau arbeitet, und hier ist die Quellenlage dünn. Solange eine noindex-Seite weiter gecrawlt wird, kann sie über ihre ausgehenden Links zunächst Equity weitergeben. Auf lange Sicht behandelt Google eine dauerhaft ausgeschlossene Seite jedoch zunehmend wie noindex, nofollow: ihre Links verlieren mit der Zeit an Wirkung (John Mueller, Google, in mehreren Office-Hours-Sessions). Eine noindex-Seite mitten in der internen Verlinkung ist damit ein langsames Leck.
Für den Linkkauf folgt daraus eine harte Regel: prüfe vor dem Kauf, ob die aufnehmende Seite indexierbar ist. Ein redaktioneller Link auf einer noindex-Seite ist verbranntes Budget, die Seite kann nicht ranken und gibt langfristig nichts weiter. Genau hier liegt der praktische Wert von Transparenz statt Blackbox: Wer einen Backlink direkt bei der aufnehmenden Redaktion platziert, sieht den Indexierungsstatus der Zielseite vorab. Bei Stringer Network arbeiten wir deshalb mit einem frei einsehbaren Medienkatalog, ohne Zwischenhändler und ohne dass man auf gut Glück in eine noindex-Falle kauft.
Auch in die Gegenrichtung lohnt der Blick: zielt eine eingekaufte Verlinkung auf eine eigene Seite, die intern auf noindex steht, läuft die ganze Kampagne ins Leere. Vor jeder Velocity-Planung gehört also ein Indexierbarkeits-Check der Zielseiten. Und für doppelte Inhalte ist der noindex oft das gröbere Werkzeug: wo Varianten konsolidiert und ihre Signale gebündelt werden sollen, ist der Canonical-Tag die elegantere Wahl, weil er die Linkkraft umleitet, statt sie zu kappen. noindex nimmt eine Seite aus dem Spiel, Canonical hält sie im Spiel und verweist auf das Original.