Ich hatte vor kurzem einen Hack, der meiner Site mehrere tausend gefälschte Seiten hinzufügte.
Ich habe eine korrigierte Sitemap an die Google-Suchkonsole gesendet (zuvor als Webmaster-Tools bezeichnet) und alle Links auf 410 gesetzt, aber die meisten von ihnen wurden von Google noch indiziert.
Ich habe WebMaster Tools - Massenentfernung von URLs Chrome Extension verwendet , um die URLs automatisch zum Entfernen zu übermitteln. Es handelt sich im Grunde genommen um ein Skript, das eine Liste der URLs erstellt und diese nacheinander für Sie einreicht. Es wird Stunden dauern, sie alle einzureichen, aber zumindest müssen Sie es nicht selbst tun. Hier ist ein Artikel darüber, wie man es benutzt .
Sie können eine Liste der von Google indizierten URLs abrufen, indem Sie die Daten direkt von der Suchkonsole herunterladen. Gehen Sie zu Status> Indexabdeckung, wählen Sie die gültigen Ergebnisse aus und scrollen Sie nach unten. Sie werden sehen, dass Google eine Menge URLs indiziert hat, die nicht in Ihrer Sitemap enthalten sind. Sie können die ersten 1000 Ergebnisse herunterladen. Es gibt anscheinend einen Umweg, um alle zu bekommen, nicht nur die ersten tausend, sondern es geht um API-Aufrufe von Excel. Ich habe nur ein paar Tage zwischen tausend gewartet, als sie langsam aus dem Index fielen.
Eine andere Möglichkeit besteht darin, dass ein WP-Plugin eine Sitemap erstellt und dann die PDF-Dateien oder was auch immer Sie anvisieren, herausfiltert. Hier müssen Sie wahrscheinlich einige manuelle Schritte zum Kopieren / Einfügen / Löschen ausführen. Aus Sicherheitsgründen habe ich langsam meine Liste mit etwa 2.700 Spam-URLs durchgeblättert und die legitimen URLs gelöscht. Es dauerte nur etwa 20 Minuten.
Wenn Sie nicht permanent versuchen, Inhalte wie Spam zu vernichten und stattdessen Premium-Ressourcen zu verschleiern, sollten Sie andere Methoden anwenden, um das Indizieren dieser Ressourcen zu verhindern, z. B. eine Robots-Datei. Aber wenn sich herausstellt, dass Google nicht zugehört hat oder Sie den Ball fallen gelassen haben, können Sie das Problem zumindest jetzt beheben und sie in nur wenigen Tagen aus dem Index entfernen.
In meinem speziellen Fall frage ich mich, warum Google keine Schaltfläche für die Zeitmaschine hat, oder warum ich sie nicht rückgängig mache oder zurücksetze. Die Idee ist, dass ich Google mitteilen kann, dass die Website vor ein paar Tagen gehackt wurde, aber wir haben sie repariert. Machen Sie daher die letzten x Tage des Crawls und Indizierens rückgängig. Das wäre aber zu einfach.