Ich bezweifle sehr, dass das Veröffentlichungsdatum eines Posts oder Artikels auf dem <lastmod>
Eintrag in einer XML-Sitemap (wie von anderen vorgeschlagen) oder dem zuletzt geänderten HTTP-Header basiert . Eine XML-Sitemap ist nur eine Empfehlung, keine verbindliche. Das letzte Änderungsdatum eines Dokuments stimmt wahrscheinlich nicht mit dem (ursprünglichen) Veröffentlichungsdatum eines Artikels überein. Und wie ich in meinem Kommentar oben auf der Seite erwähnt habe, ist das Datum der letzten Änderung eines Dokuments wahrscheinlich wichtiger für das Zwischenspeichern und möglicherweise das Ermitteln der Durchforstungsraten. Die zuletzt geänderten HTTP-Header dynamisch generierter Seiten sind häufig sehr nahe am tatsächlichen Datum / der Uhrzeit (wie dies bei WordPress-Blogs der Fall ist).
Ein RSS / Atom-Feed hingegen enthält dieses spezifische Informationsnugget. Auf Wordpress-Websites, auf denen das Veröffentlichungsdatum nicht im Inhalt enthalten ist, wird das Veröffentlichungsdatum weiterhin in den Suchergebnissen von Google angezeigt. Und soweit ich das beurteilen kann, stimmt dies mit dem Datum im RSS-Feed überein.
EDIT # 1: Ein RSS-Feed enthält jedoch nicht unbedingt alle Seiten. In den meisten Fällen sollte es nur die neuesten oder zuletzt aktualisierten Seiten enthalten. Es gibt jedoch keinen Grund, dass Google vergisst, was es bereits gelesen hat, und dass sich der Inhalt dieser Seite nicht geändert hat, und dass sich auch das Datum der letzten Änderung nicht geändert hat.
Wenn es keinen RSS-Feed gibt, ist Google meiner Meinung nach clever genug, um den Seiteninhalt zu analysieren. Insbesondere, wenn Daten mit Hilfe von Mikroformaten 'semantisch' markiert werden . Es ist durchaus möglich, dass Google Folgendes als maßgebliches Veröffentlichungsdatum für einen darin enthaltenen Artikel ansieht:
<abbr class="published" title="2010-08-27T15:45:00-0700">
Friday, August 27th, 2010
</abbr>
Google liest auf jeden Fall Mikroformate - hCard, hReview usw.
Um es hinzuzufügen, ich glaube nicht, dass Google ein Veröffentlichungsdatum angeben würde, wenn es nicht in der Lage wäre, etwas maßgebliches zu finden, das dies nahelegt. Es wird kein "Veröffentlichungsdatum" für spekulative Daten hergeleitet, da ein falsches "Veröffentlichungsdatum" für niemanden von Nutzen ist und Google viel Geld dafür bekommen würde!
Und nur zur Veranschaulichung (wenn @Tom etwas anderes vorschlägt :) Ich denke, bei Posts / Artikeln sollte das Veröffentlichungsdatum sichtbar angezeigt werden. Viele tun dies nicht, und dies kann für den Leser frustrierend sein, insbesondere wenn er technische Probleme untersucht, und Sie feststellen, dass es nicht mehr aktuell ist, wenn Sie den Artikel zur Hälfte durchgelesen haben!
EDIT # 2: Ich habe seitdem einen ähnlichen Ärger erlebt , den @mmdanziger in seiner Antwort ausführlich beschreibt. Auf einer meiner alten Seiten habe ich oben auf jeder Seite (geschrieben auf die Seite mit JavaScript !!) den Text des Formulars "Site Last Updated Sun 17th Jun 2012" (nicht in besonderer Weise markiert ). Das gleiche Datum wurde von Google aufgenommen und erscheint nun neben einige (aber nicht alle) Seiten , die in dem SERPS erscheinen - dies sicherlich nicht das Datum der Seite veröffentlichen ist. Es sieht so aus, als würde Google einfach die Seite nach einer Zeichenfolge der Form "Zuletzt aktualisiert" durchsuchen ( sieht Datumsangabe )" durchsuchen (nachdem JavaScript verarbeitet wurde !!). Diese Website hat keinen RSS-Feed. Die Site verfügt zwar über eine Sitemap.xml-Datei, die Daten sind jedoch unterschiedlich.
Ich habe ein ähnliches Verhalten auch auf anderen Websites festgestellt.