robots.txt vorhanden

Ohne robots.txt fehlt eine zentrale Steuerung für Bots.

Das Thema dieser Seite: Die robots.txt ist das erste Steuerungsinstrument für Crawler und muss erreichbar sowie technisch sauber sein.

Zurück zur Übersicht

Inhalt

Klicke auf einen Abschnitt, um direkt dorthin zu springen.

Der Check ruft /robots.txt ab, bewertet den Statuscode und prüft, ob eine verwertbare robots.txt ausgeliefert wird.

Prüfpunkt	Bedeutung	Bewertung
Status 200, Inhalt lesbar	robots.txt erreichbar und nutzbar	OK
Status 403/401	Robots blockiert oder geschützt	Warnung
Status 404/5xx	Datei fehlt oder Serverfehler	Kritisch

Fehlende robots.txt tritt häufig nach Relaunches, bei neuen Domains oder bei Staging-Umgebungen auf.

Situation	Symptom	Risiko
Neuer Launch	robots.txt fehlt	Kein zentraler Crawler-Hinweis
Staging kopiert	robots blockiert produktiv	Indexierung bleibt aus
CDN/Firewall	403 auf /robots.txt	Robots nicht erreichbar

Die Datei muss im Root liegen und als Text ausgeliefert werden. Auch leere Dateien werden von Crawlern gelesen, liefern aber keine Hinweise.

User-agent: *
Disallow:
Sitemap: https://example.com/sitemap.xml

Interne Links

Nächste Schritte für Crawling & Indexierung.

Zurück zur Übersicht

Stellt sicher, dass die Sitemap gefunden werden kann.

Verknüpft die Sitemap direkt im robots.txt.

Prüft, ob wichtige URLs zugelassen sind.