Gibt es eine Möglichkeit, Suchmaschinen mitzuteilen, dass eine von ihnen gecrawlte Seite jetzt in die Suchergebnisse aufgenommen werden soll, aber zu einem bestimmten Zeitpunkt in der Zukunft gelöscht werden muss?
Ich habe eine Website, auf der täglich Hunderte von Veröffentlichungen stattfinden, und ich möchte, dass sie gecrawlt und durchsuchbar sind. Ich bin jedoch gesetzlich verpflichtet, die Informationen nach einer Weile zu entfernen (individuelles Datum für jede Seite).
Nach diesem angegebenen Datum ist die Seite auf meiner Website nicht mehr sichtbar (HTTP-Antwort 410 weg), aber die Seite verbleibt z. B. eine Weile im Google-Cache, was zu rechtlichen Problemen für mich führen kann. Offensichtlich ist es nicht möglich, Hunderte von Anfragen zum Entfernen von Inhalten per Hand an Google zu senden. Auf der anderen Seite werden die einzelnen Seiten einige Monate lang nicht geändert, bis sie verworfen werden müssen, sodass Google Bot nicht oft eincheckt.
Soweit ich weiß, ist der HTTP Expires-Header eine Bezeichnung für minimale Aktualisierungen und nicht für maximale Lebensdauer, richtig? Ich sende zuletzt geänderte at- und etag-Header, aber sie helfen hier nicht weiter. Gibt es eine Möglichkeit, "Cache, aber nur bis 15.08.2011" zu sagen?