Ich migriere meine gut indizierte Website nur von HTTP auf HTTPS.
Geplante Schritte:
- Alle HTML-Seiten können jetzt HTTPS sein
- Alle HTTP-Seiten werden mit derselben URL zu HTTPS umgeleitet
- Alle Sitemaps haben HTTPS-URLs
- Alle Links auf HTML-Seiten sind HTTPS
Fehler 1:
Derzeit robots.txt
auf HTTPS-Ebene nicht zulassen, da der Crawler keine HTTPS-Seiten crawlen soll.
Was sollte unser Ansatz jetzt sein: Es ist offensichtlich, dass jetzt https für alle Links zulässig sind.
Aber was ist mit dem Zulassen / Nicht-Zulassen von HTTP (als ob HTTP nicht gecrawlt worden wäre, wie würde es wissen, dass nichts Neues passiert ist, nur HTTP wurde auf HTTPS migriert)? 301 zeigt dies an, aber das passiert nur, wenn der Crawler dieselbe Seite mit öffnet HTTP.
Ausgabe 2:
Wenn ich in der Sitemap alle HTTPS-Links hinzufüge, komme ich zu derselben Frage wie oben. Crawler beginnt mit dem Crawlen von https-Links und indiziert diese. Wir möchten jedoch, dass es weiß, dass es sich um dieselbe HTTP-Version handelt, und Rankings weitergibt
Idealerweise sollten wir für einige Zeitspanne, bis alle unsere Links mit HTTPS indiziert sind, sowohl HTTP als auch HTTPS in Sitemaps haben?
Nach heutigem Kenntnisstand ist der folgende Plan:
Wenn Google aufhört, http zu crawlen, werden keine Rankings bestanden. Daher plane ich, sowohl http als auch https zuzulassen, da es sich um Roboter handelt.
Aber ich weiß nicht, wie sie es wie auf unserem Webserver crawlen werden. Wir leiten alle http-Links zum https-Gegenstück um. Selbst wenn das Stammverzeichnis meiner Website http://www.example.com gecrawlt wird, wird es schließlich zu https://www.example.com weitergeleitet, wo es alle https-Links findet und dem folgt.
Möglicherweise wird auch versucht, die bereits indizierten Links (alle http-Links) zu crawlen, und es wird festgestellt, dass sie umgeleitet werden. Dies hängt jedoch vom Crawlerverhalten und der Häufigkeit ab. In der Zeitspanne zwischen dem Verständnis des Crawlers von 301 und der ebenfalls gecrawlten https-Version führt dies zu Problemen mit doppelten Inhalten und wirkt sich daher auf unsere Platzierungen aus.