Ich möchte alle Dateien für eine bestimmte Website unter archive.org abrufen. Gründe könnten sein:
- Der ursprüngliche Autor hat seine eigene Website nicht archiviert und sie ist jetzt offline. Ich möchte einen öffentlichen Cache daraus erstellen
- Ich bin der ursprüngliche Autor einer Website und habe Inhalte verloren. Ich möchte es wiederherstellen
- ...
Wie mache ich das ?
In Anbetracht dessen, dass die Wayback-Maschine von archive.org etwas ganz Besonderes ist: Webseiten-Links verweisen nicht auf das Archiv selbst, sondern auf eine Webseite, die möglicherweise nicht mehr vorhanden ist. JavaScript wird clientseitig verwendet, um die Links zu aktualisieren, aber ein Trick wie ein rekursiver Wget funktioniert nicht.
gem install wayback_machine_downloader
. Führen Sie wayback_machine_downloader mit der Basis-URL der Website aus, die Sie als Parameter abrufen möchten:wayback_machine_downloader http://example.com
Weitere Informationen: github.com/hartator/wayback_machine_downloader