Wenn Sie möchten, dass diese Seiten nicht für die Öffentlichkeit sichtbar sind, geben Sie am besten ein Kennwort für diese Seiten ein. Und / oder eine Konfiguration haben, die nur bestimmte Adressen auf der Whitelist zulässt, die auf die Site zugreifen können (dies kann auf Serverebene erfolgen, wahrscheinlich über Ihren Host oder Serveradministrator).
Wenn Sie möchten, dass diese Seiten vorhanden sind, nur nicht von Google oder anderen Suchmaschinen indiziert, wie andere bereits erwähnt haben, haben Sie einige Optionen, aber ich denke, es ist wichtig, hier zwischen den beiden Hauptfunktionen der Google-Suche zu unterscheiden Sinn: Crawlen und Indizieren.
Crawling vs. Indizierung
Google crawlt Ihre Website, Google indiziert Ihre Website. Die Crawler finden Seiten Ihrer Site, die Indizierung organisiert die Seiten Ihrer Site. Weitere Informationen dazu hier .
Diese Unterscheidung ist wichtig, wenn Sie versuchen, Seiten aus dem "Index" von Google zu blockieren oder zu entfernen. Viele Leute blockieren standardmäßig nur über robots.txt. Dies ist eine Anweisung , die Google sagt, was (oder was nicht) gecrawlt werden soll. Wenn Google Ihre Website nicht crawlt, ist es häufig unwahrscheinlich, dass sie indiziert wird. Es ist jedoch sehr häufig, dass Seiten von robots.txt blockiert und in Google indiziert werden.
Anweisungen an Google & Suchmaschinen
Diese Art von "Direktiven" sind lediglich Empfehlungen an Google, auf welchen Teil Ihrer Website gecrawlt und indiziert werden soll. Sie müssen ihnen nicht folgen. Das ist wichtig zu wissen. Ich habe im Laufe der Jahre viele Entwickler gesehen, die dachten, sie könnten die Site einfach über robots.txt blockieren, und plötzlich wird die Site einige Wochen später in Google indiziert. Wenn jemand anderes auf die Website verlinkt oder wenn einer der Crawler von Google sie irgendwie in den Griff bekommt, kann sie dennoch indiziert werden .
Mit dem aktualisierten Dashboard von GSC (Google Search Console) wurde dieser Bericht kürzlich als "Index Coverage Report" bezeichnet. Hier stehen Webmastern neue Daten zur Verfügung, die zuvor nicht direkt verfügbar waren, und spezifische Details zum Umgang von Google mit bestimmten Seiten. Ich habe viele Websites gesehen und gehört, die "Warnungen" mit der Bezeichnung "Indiziert, aber von Robots.txt blockiert" erhalten haben.
In der neuesten Dokumentation von Google wird erwähnt, dass Sie, wenn Sie Seiten aus dem Index entfernen möchten, keine Index-Nofollow-Tags hinzufügen.
URLs-Tool entfernen
Nur um auf dem aufzubauen, was einige andere über das Tool "URL entfernen" erwähnt haben ...
Wenn die Seiten bereits indiziert sind und dringend veröffentlicht werden müssen, können Sie mit dem Google-Tool "URLs entfernen" Seiten "vorübergehend" aus den Suchergebnissen blockieren. Die Anfrage dauert 90 Tage, aber ich habe sie verwendet, um Seiten schneller aus Google zu entfernen als mit noindex, nofollow, ähnlich einer zusätzlichen Ebene.
Mit dem Tool "URLs entfernen" wird die Seite von Google weiterhin gecrawlt und möglicherweise zwischengespeichert. Während Sie diese Funktion verwenden, können Sie die Noindex-Nofollow-Tags hinzufügen, damit sie angezeigt werden und bis zu den 90 Tagen Nach oben wird es hoffentlich wissen, dass Sie Ihre Seite nicht mehr indizieren müssen.
WICHTIG: Die Verwendung der Nofollow-Tags robots.txt und noindex ist ein etwas widersprüchliches Signal für Google.
Der Grund dafür ist, dass wenn Sie Google anweisen, eine Seite nicht zu crawlen, und Sie dann noindex nofollow auf dieser Seite haben, es möglicherweise nicht crawlt, um das noindex nofollow-Tag zu sehen. Es kann dann durch eine andere Methode indiziert werden (ob ein Link oder so). Die Details, warum dies passiert, sind ziemlich vage, aber ich habe gesehen, dass es passiert.
Kurz gesagt, meiner Meinung nach besteht die beste Möglichkeit, die Indizierung bestimmter URLs zu verhindern, darin, diesen Seiten ein Noindex-Nofollow-Tag hinzuzufügen. Damit stellen Sie sicher , dass Sie nicht diese URLs auch mit robots.txt blockiert, so dass könnte Google verhindern , richtig diese Tags zu sehen. Sie können das Tool "URLs aus Google entfernen" nutzen, um sie vorübergehend in den Suchergebnissen auszublenden, während Google Ihren No-Index-Nofollow verarbeitet.