Kann eine relative Sitemap-URL in einer robots.txt verwendet werden?


191

Kann ich in robots.txt die folgende relative URL für die Sitemap-Datei schreiben?

sitemap: /sitemap.ashx

Oder muss ich die vollständige (absolute) URL für die Sitemap-Datei verwenden, wie:

sitemap: http://subdomain.domain.com/sitemap.ashx

Warum ich mich frage:

  • Ich besitze einen neuen Blog-Dienst, www.domain.com, mit dem Benutzer auf accountname.domain.com bloggen können.
  • Ich verwende Platzhalter, daher verweisen alle Subdomains (Konten) auf: "blog.domain.com".

In blog.domain.com habe ich die robots.txt eingefügt, damit Suchmaschinen die Sitemap finden können. Aufgrund der Platzhalter verwenden alle Benutzerkonten dieselbe robots.txt-Datei. Deshalb kann ich die zweite Alternative nicht verwenden. Und im Moment kann ich URL Rewrite nicht für TXT-Dateien verwenden. (Ich denke, dass spätere Versionen von IIS damit umgehen können?)

Antworten:


318

Laut der offiziellen Dokumentation auf sitemaps.org muss es sich um eine vollständige URL handeln:

Sie können den Speicherort der Sitemap mithilfe einer robots.txt-Datei angeben. Fügen Sie dazu einfach die folgende Zeile mit der vollständigen URL zur Sitemap hinzu:

Sitemap: http://www.example.com/sitemap.xml

31
Bitte beachten Sie, dass das Beispiel von @ unor lautet: Sitemap mit Großbuchstaben S. Dies ist wichtig, da bei Robots.txt zwischen Groß- und Kleinschreibung unterschieden wird.
BodgeIT

19
Und zum Thema Fall gibt robotstxt.org die Datei an, die robots.txtohne die Hauptstadt R benannt werden soll
khargoosh

Wenn die Site https lädt, wird die Sitemap-URL mit http angegeben. Ist das in Ordnung? Oder müssen wir die Sitemap-URL basierend auf dem Protokoll platzieren?
Shams

4
@Shams: Die in Ihrer Sitemap aufgeführten URLs müssen dasselbe Protokoll und denselben Host wie die Sitemap-Datei verwenden. Wenn Ihre Site unter http und verfügbar ist https, sollten Sie nur eine Sitemap (mit der kanonischen Variante) bereitstellen .
Unor

2

Google-Crawler sind nicht intelligent genug, sie können keine relativen URLs crawlen. Daher wird immer empfohlen, absolute URLs zu verwenden, um die Crawlbarkeit und Indexierbarkeit zu verbessern.

Daher können Sie diese Variante nicht verwenden

> sitemap: /sitemap.xml

Empfohlene Syntax ist

Sitemap: https://www.yourdomain.com/sitemap.xml

Hinweis:

  • Vergessen Sie nicht, den ersten Buchstaben in "Sitemap" groß zu schreiben.
  • Vergessen Sie nicht, nach "Sitemap:" Platz zu setzen.

-2

Gute technische und logische Frage, mein lieber Freund. Nein, in der robots.txt-Datei können Sie nicht mit der relativen URL der Sitemap arbeiten. Sie müssen mit der vollständigen URL der Sitemap gehen.

Es ist besser, mit "Sitemap: https://www.example.com/sitemap_index.xml " zu gehen "

In der obigen URL gibt der Doppelpunkt Platz. Ich unterstütze auch gerne Deepak.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.