Was können Sie NICHT bei Google finden? [geschlossen]


18

Google behauptet, fair zu sein, und es liegt im Interesse des Unternehmens (meistens), das Internet nach allem und jedem abzusuchen, auf das seine Spinnen zugreifen können. Ich möchte gerne wissen:

  • Welche Art von (öffentlich zugänglichen) Inhalten liefert Google nicht aus?
  • Gibt es eine bestimmte Art von Inhalten, die Google nicht abrufen kann?

Verweise, insbesondere auf Googles eigene Dokumentation, wären besonders beeindruckend.


Jetzt, da die EU ein "Recht auf Vergessenwerden" erlassen hat, werden wir eine ganze Menge nicht mehr finden können. Hier sind einige Dinge, die "vergessen" wurden.
Samthebrand

Antworten:


21

Ein paar Ideen zur Art der Dinge:

  1. Inhalte, die von der robots.txtDatei einer Domain ausdrücklich nicht zugelassen werden , werden aus dem Google-Index ausgeschlossen.
  2. Websites, die nicht von anderen Websites verlinkt sind, die Google bereits kennt. Das heißt, es gibt wahrscheinlich viele Websites, die nicht von sichtbaren Seiten verlinkt werden. Diese Websites werden von Google Spider nur gefunden, wenn sie manuell über die Webmaster-Tools an Google übermittelt werden .
  3. Websites, die sich hinter Webformularen befinden, die Sie ausfüllen müssen.
  4. Volkszählungsbilder. Da es sich bei den Inhalten um Bilder handelt, die häufig manuell indiziert werden, werden sie normalerweise auf kostenpflichtigen Websites wie ancestry.com gefunden.

Erfahren Sie mehr über das Deep Web


2
Punkt 2 ist nicht wahr. Sie können eine Website über die Webmaster-Tools bei Google einreichen. Sie wird indiziert, auch wenn sie nicht von anderen Websites verlinkt wurde.
Alex

Das ist wahr. Gute Klarstellung.
amh

3
Eigentlich werde ich mit dem zweiten Punkt nicht einverstanden sein. Ich hatte einen Test-Webserver auf meinem PC und dieser wurde indiziert. Ich habe dies anhand des Zugriffsprotokolls festgestellt.
Bakudan

2
Ich habe neue Domains registriert, mit der Entwicklung begonnen und festgestellt, dass Googlebot sie nur wenige Tage später crawlt. Ich fand das irgendwie gruselig, bis mir klar wurde, dass ich möglicherweise nicht der erste bin, der diese Domain besitzt :) Sie geben keine Details preis, aber ich bin mir sicher, dass sie die Domains nachverfolgen, von denen die Leute dachten, dass sie wichtig genug sind, um sich zu registrieren und bei Wenigstens ein paar Besucher , zumindest für einen gewissen Zeitraum.
Tim Post

6

Abgesehen von Twitter indiziert Google Tumblr nicht so gut. Blog-Posts auf Tumblr sind mit der Tumblr-Suche einfacher zu finden. Auch alles auf Google Sites ist nicht (oder kaum) indiziert. Wenn Sie eine Google-Site starten, besorgen Sie sich Ihre eigene Domain.

Kleinere Blogs, die nicht regelmäßig aktualisiert werden, werden häufig aus den Suchergebnissen entfernt. Plus alles, was sie denken, ist ein Splog .


5

Nun, die meisten Twitter-Inhalte werden von Google nicht indiziert, auch wenn sie öffentlich sind. Früher war es für Google verfügbar, aber das ist seit dem Ablauf der Vereinbarung nicht mehr der Fall.

Quelle .


Zwar stellt sich die Frage, welche "hochwertigen Inhalte" in Google nicht verfügbar sind. Die meisten Twitter-Nutzer würden diese Kriterien nicht erfüllen.
HappyTimeGopher

4

Es hängt davon ab, in welchem ​​Land Sie sich befinden. In Deutschland werden nicht Tausende von Websites angezeigt, die die Regierung für nicht gut hält, und die Liste wird jedes Jahr um Tausende erweitert.

Google ist der Motor der Internet-Zensur. Wenn Sie ein kostenloses Internet wünschen, nutzen Sie einige nicht böse Unternehmen wie DuckDuckGo oder andere.




1

Websites mit so viel Inhalt, dass Google einfach nicht die Zeit (oder die Neigung) hatte, alles zu indizieren.

Websites, für die keine durchsuchbare Sitemap vorhanden ist und für die Google Suchbegriffe für den Zugriff auf die auf der Website verfügbaren Ergebnisse benötigt, werden möglicherweise nicht vollständig indiziert.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.