Wie finde ich heraus, wann eine URL zum ersten Mal von Google indiziert wurde?


16

Wie finde ich heraus, wann eine bestimmte URL zum ersten Mal von Google indiziert wurde? Ich würde eine Lösung vorziehen, die auch für die URLs von Mitbewerbern funktioniert, die mir nicht gehören.


1
Es ist gut möglich, dass die Antwort "nein" ist. Google speichert diese Informationen möglicherweise nicht einmal (da es keinen bestimmten Grund gibt, warum dies erforderlich ist), oder sie werden sie, selbst wenn dies der Fall ist, möglicherweise nicht an Dritte weitergeben.
Ilmari Karonen

1
Wie andere bereits erwähnt haben, können Sie diese Informationen nicht abrufen. Wenn Sie Zugriff auf die Serverprotokolle haben, können Sie sehen, wann sie zum ersten Mal gecrawlt wurden, aber selbst das bedeutet nicht, dass sie dann indiziert wurden.
John Mueller

Antworten:


15

Um das Alter einer URL zu ermitteln, können Sie diesem Link folgen, www.example.comindem Sie die gewünschte URL eingeben:

https://www.google.com/search?tbs=cdr%3A1%2Ccd_min%3A1%2F1%2F2000&q=site%3Ahttp%3A%2F%2Fwww.example.com&safe=active&gws_rd=ssl

Hier ist das Ergebnis von Google für die Meta-Site von Stack Overflow : Bildbeschreibung hier eingeben

Ansonsten ist die Wayback-Maschine auch eine gute Lösung, aber meiner Erfahrung nach weniger genau.


3
Ist diese Funktion von Google auch auf Englisch verfügbar? Sie haben auf die französische Version verlinkt.
Stephen Ostermiller

1
@StephenOstermiller Ändern Sie einfach die tld von .frzu .com.
MDMoore313

2
@Zistoloen +1 für Ihre Antwort, aber ich habe Zweifel an Ihrer Anfrage. Wie Sie bereits sagten, habe ich anhand Ihrer Beispielabfrage nach www.stackexchange.com gesucht, aber es werden keine Ergebnisse angezeigt . Ich habe gesucht, indem ich wwwauch zu diesem Zeitpunkt entfernt habe, dass das Ergebnis für das Datum Dec 1, 2014angezeigt wird, das ein sehr aktuelles Datum ist, das nicht das Alter der URL sein kann. Suche ich falsch oder etwas vermissen?
Sathiya Kumar

2
Ich habe diese Antwort "gestohlen" und sie mit einer besseren Erklärung zu meiner Antwort hinzugefügt. Das ist ein toller Trick, Zistoloen.
Stephen Ostermiller

6
@Stephen & Zistoloen: Dies ist im Allgemeinen nicht das Datum, an dem die Seite zum ersten Mal von Google indexiert wurde. Basierend auf einigen Tests scheint das mit dieser Methode angezeigte Datum entweder aus dem Inhalt der Seite entnommen worden zu sein (wenn Google glaubt, dass es etwas sieht, das wie ein Datum "veröffentlicht am" oder "zuletzt geändert am" aussieht) oder, wenn dies nicht der Fall ist Das Datum wird im Inhalt basierend auf dem Datum gefunden, an dem Google zuletzt eine (erhebliche?) Änderung an der Seite festgestellt hat. Wenn die Seite nie nach seiner ersten Veröffentlichung geändert wurde, dies natürlich könnte passiert das gleiche wie sein Veröffentlichungsdatum sein, aber es gibt keine Garantie dafür.
Ilmari Karonen

8

Zistoloen hat eine Möglichkeit gefunden, Google das Datum anzeigen zu lassen, an dem der Inhalt der Seite zum ersten Mal indiziert wurde. Ich füge es auch meiner Antwort hinzu, weil ich denke, dass ich es klarer erklären kann.

  1. Durchsuchen Sie Google nach etwas, das die gewünschte Seite als Ergebnis anzeigt
  2. Verwenden Sie "Suchwerkzeuge"
  3. Wählen Sie "Benutzerdefinierter Bereich ..." aus der Dropdown-Liste "Jederzeit"
  4. Geben Sie einen großen Datumsbereich ein, z. B. 1.1.1900 bis 1.1.2020

Google zeigt dann im Suchergebnis das Datum an, an dem der Inhalt auf der Seite gefunden wurde.

zuerst indiziert

Wenn die Seite mit neuem Inhalt aktualisiert wird, aktualisiert Google auch dieses Datum. Es handelt sich also eher um ein Datum, an dem dieser Inhalt zum ersten Mal indiziert wurde, als um ein Datum, an dem diese URL zum ersten Mal indiziert wurde.


Der Google-Cache für eine Seite zeigt an, wann die Seite zuletzt indexiert wurde. Sie können sehen, dass die Stack Exchange-Homepage heute zuletzt indiziert wurde:

Bildbeschreibung hier eingeben


Eine andere Option ist die Verwendung des Wayback-Rechners des Internet-Archivs . Das zeigt Ihnen, wie eine Seite in der Vergangenheit aussah. Sie können herausfinden, wann die Seiten zum ersten Mal veröffentlicht wurden. Sowohl Google als auch das Internetarchiv crawlen und verwenden die Seite kurz nach ihrer Erstveröffentlichung.


1
Wird Ihre erste Option ein genaues Ergebnis für alle URLs liefern? Ich habe nach bing.com gesucht, wie Sie erklärt haben, aber das erste indizierte Datum von nicht erhalten bing.com. Entschuldigung, wenn ich falsch liege?
Sathiya Kumar

1
Es scheint genau zu sein, solange sich der Inhalt der Seite nicht geändert hat. Google kann dieses Datum zurücksetzen, wenn die Seite überarbeitet wird. Meine Homepage ist als 1. Februar 2002 aufgeführt, obwohl eine interne Seite als 1. Februar 2001 aufgeführt ist. Die Homepage wurde zu dieser Zeit umgestaltet, während sich die interne Seite seit 2001 nicht wesentlich geändert hat.
Stephen Ostermiller

@SathiyaKumar Bing.com gibt das Datum 19. März 2014 für mich mit dieser Methode. Beachten Sie, dass alles, was nicht von Google indiziert wurde (über robots.txt oder auf andere Weise), auf diese Weise nicht angezeigt wird.
Thebluefish

4

Möglicherweise gibt es keine Möglichkeit, herauszufinden, wann eine beliebige Webseite zum ersten Mal von Google indiziert wurde - ich kenne sicherlich keine Möglichkeit, dies zu tun. Es ist möglich, dass Google diese Informationen einfach nicht speichert, da es keinen wirklichen Grund dafür gibt. Außerdem haben sie, selbst wenn sie diese Informationen speichern, keinen besonderen Grund, sie Dritten frei zugänglich zu machen.

(Wenn es sich um Ihre eigene Seite handelt und Sie Zugriff auf Ihre alten Webserver-Zugriffsprotokolle haben, ist dies ganz einfach. Durchsuchen Sie die Protokolle nach dem ersten Besuch von Googlebot auf dieser Seite. Andernfalls besteht möglicherweise keine Möglichkeit, dies mit Sicherheit festzustellen.)


Die von Zistoloen und Stephen Ostermiller in ihren Antworten beschriebene Methode gibt in der Regel nicht das Datum an, an dem eine bestimmte URL zum ersten Mal von Google indiziert wurde. Vielmehr wird das Datum angezeigt, an dem Google den Inhalt der URL für veröffentlicht oder zuletzt aktualisiert hält, und es basiert häufig auf den mehr oder weniger zuverlässigen Versuchen von Google, Daten aus dem Seiteninhalt selbst herauszuspüren.

In diesem Video geht Matt Cutts von Google kurz auf die Auswahl dieser Daten ein. Der Einfachheit halber habe ich den relevanten Teil des Videos (ungefähr von 2:09 bis 2:22) unten transkribiert:

"... Oft wird das Datum angezeigt, wenn wir es ableiten oder wenn wir es zum ersten Mal gesehen haben, wann immer wir diese Seite gecrawlt haben oder wenn wir es irgendwo auf der Seite finden und wir dieses Datum extrahieren können." Das sehe ich gleich am Anfang des Snippets. "

Bei Seiten wie Blog-Posts, Wiki-Seiten oder Stack Exchange-Fragen, bei denen die Website, auf der die Software ausgeführt wird, automatisch ein genaues Erstellungs- / Änderungsdatum auf der Seite selbst meldet, stimmt das von Google gemeldete Datum wahrscheinlich mit diesem überein. Für andere Arten von Seiten muss der Datums-Sniffer von Google jedoch härter arbeiten und macht es nicht immer richtig (was auch immer "richtig" in diesem Kontext bedeuten mag).

Insbesondere sind diese Daten aus zwei Gründen für die Ermittlung der Indexierungszeit einer Seite grundsätzlich unbrauchbar :

  • Wenn eine Seite kürzlich geändert wurde und das Änderungsdatum auf der Seite deutlich sichtbar ist, wird es möglicherweise von Google als "Datum" der Seite übernommen, auch wenn die Änderung völlig unbedeutend war.

    Zum Beispiel diese ziemlich alt Wiki - Seite (die archive.org 2003 zunächst indiziert ) wird derzeit datestamped von Google ab November sein 10 2014 - das Datum , an dem sie wurde zuletzt bearbeitet, wie im unteren Teil der Seite angezeigt. Die Änderung, die an diesem Datum passiert ist? Entfernen Sie einfach einen einzelnen Link vom unteren Rand der Seite.

  • Umgekehrt ist Google anscheinend froh, sehr alte "Veröffentlichungsdaten" zu akzeptieren, wenn sie auf der Seite gefunden werden - auch solche, die vor dem Start des World Wide Web lagen .

    Zum Beispiel ist diese Seite eines alten Programmierwettbewerbs von Google auf den 15. September 1986 datiert - tatsächlich das Datum des auf der Seite beschriebenen Ereignisses. In ähnlicher Weise ist diese Seite, die einen Studentenstreik 1970 dokumentiert, von Google auf den 10. Mai 1970 datiert (das Datum eines der gescannten Dokumente auf der Seite), und noch absurder ist, dass diese Linux-Handbuchseite von Google auf den 4. November datiert ist , 1989 (ein zufälliges Beispieldatum, das auf der Seite verwendet wird).

    Sie können noch viele weitere Beispiele finden, indem Sie die von Stephen und Zistoloen beschriebene benutzerdefinierte Suche nach Datumsbereichen verwenden, das obere Ende des Bereichs jedoch beispielsweise auf den 6. August 1991 festlegen .


In Ihrer Antwort haben Sie hauptsächlich die Antworten von Stephen und Zistoloen abgelehnt, aber ich finde keine richtige Antwort auf die Frage von OP "Wie finde ich, wann eine URL zum ersten Mal von Google indexiert wurde?" in deiner Antwort !!
Sathiya Kumar

Möglicherweise gibt es keine Antwort, außer "Sie können nicht" oder "niemand weiß wie". Aber Sie haben Recht, lassen Sie mich das in meine Antwort ändern.
Ilmari Karonen

@llmariKaronen +1 zum Bearbeiten und Hinzufügen der Antwort auf die eigentliche Frage von OP.
Sathiya Kumar
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.