Jemand hat mein WordPress-Blog geklont. Wie kann ich verhindern, dass es SEO schadet?

Mein WordPress-Blog ist vollständig geklont. Diese Klonseite wird in Echtzeit mit meinem Blog aktualisiert. Ich bin überrascht, dass jemand das tatsächlich kann.

Was kann ich tun, um schädliche Auswirkungen in meinem Suchmaschinenranking zu stoppen? Gibt es eine Möglichkeit, Google anzuweisen, diese Website nicht zu indizieren?

wordpress scraper-sites

— Tanvir Hasan
quelle

Ich sehe, dass dies jetzt "behoben" zu sein scheint - die geklonte Site ist nicht mehr "klonen". Wie haben Sie das am Ende erreicht?

— MrWhite

@ w3d Nach zwei Wochen und mehreren Gesprächen mit Amazon Hosting beschlossen sie, diese geklonte Site zu schließen. Vielen Dank an alle.

— Tanvir Hasan

Beachten Sie, dass sich dmca.com und google.com/webmasters/tools/dmca-dashboard unterscheiden, wenn Sie einen Verstoß geltend machen möchten .

— Showcase Imagery

Antworten:

Sie laden Ihre Site einfach über ein serverseitiges Skript. Sie müssen lediglich die IP-Adresse des Servers über .htaccess blockieren. Öffnen Sie einfach die Zugriffsprotokolle Ihres Servers, öffnen Sie die geklonte Seite auf seiner Site, zeigen Sie Ihr Protokoll für den neuen Eintrag an und Sie erhalten dessen IP-Adresse.

Es würde auch nicht schaden, eine DMCA-Anfrage auch an Google zu senden, aber dies ist nicht wirklich notwendig, da dieser Inhalt sofort verschwindet, sobald Sie ihre IP-Adresse blockieren.

— John Conde
quelle

Ich werde den Vorschlag, eine DMCA-Anfrage an Google zu richten, noch einmal verdoppeln. Wir sehen in letzter Zeit verschiedene Formen davon und ich bin mir einfach nicht sicher, wie sich das auszahlen würde. Ich würde jedoch vorschlagen , sie für einen bestimmten Zeitraum nicht zu blockieren, während Google dies tut - dann würde ich sie blockieren -, aber Sie müssen dies möglicherweise nicht tun, wenn Google die Liste aufhebt. Ich schlage nur vor, dass Sie, wenn Sie eine DMCA-Beschwerde bei Google einreichen, diesen eine Frist zur Untersuchung geben, bevor Sie sie blockieren. Ansonsten einfach sofort blockieren.

— Schranknoc

Hallo John Conde, ich habe versucht, die Blockierung ihrer IP-Adresse über die .htaccess-Datei mit diesem Code zu blockieren. Befehl Befehl Verweigern, Verweigern von [dieser IP-Adresse] zulassen der richtige Code, um diese IP zu blockieren?

— Tanvir Hasan

@ TanvirHasan Das ist die richtige Idee, vorausgesetzt, Sie haben die richtige IP-Adresse. Wird diese IP-Adresse immer noch in Ihrem Zugriffsprotokoll angezeigt, wenn Sie die "geklonte Site" besuchen?

— MrWhite

Mein Hosting-Anbieter gibt diese Befehle in die .htaccess-Datei ein und sie sind diejenigen, die diese IP-Adresse aus dem Protokoll erhalten. Aber es funktioniert nicht.

— Tanvir Hasan

Wurde das jemals gelöst?

— Schranknoc

(Zusätzlich zu @ Johns Antwort.)

Gibt es eine Möglichkeit, Google anzuweisen, diese Website nicht zu indizieren?

Eher neugierig , dass , während sie geklont zu haben scheinen alles (einschließlich Ihrer XML - Sitemaps ^{* 1} ), sie haben die Datei robots.txt nicht geklont. Tatsächlich blockiert die robots.txt auf dieser Site aktiv das Crawlen von allem! In dieser Hinsicht scheint es also nichts zu tun zu geben. Wenn Sie eine Site-Suche in dieser Domain durchführen, wird nur die nackte Domain und ein Hinweis zurückgegeben, der besagt, dass sie von robots.txt blockiert wird.

(Eher neugierig, was ihre Absicht dabei sein würde? Sie könnten vielleicht einfach annehmen, dass sie einen Fehler mit robots.txt gemacht haben - und das vielleicht auch -, aber das sieht für mich eher nach einer absichtlichen Ausnahme aus?)

~~Während Ihre XML-Sitemaps geklont werden, aktualisieren sie die darin enthaltenen URLs nicht (wie auf den Hauptseiten der Website), sodass sie weiterhin auf Ihre Website verweisen.~~

^{* 1} In Bezug auf die XML-Sitemap (s). Auf Ihrer Site ist "sitemap.xml" tatsächlich eine Weiterleitung zu "sitemap_index.xml" und die geklonte Site hat tatsächlich die Weiterleitung geklont ... die zurück zu Ihrer Site weiterleitet! (Sicherlich ein Fehler von ihrer Seite.) "Sitemap_index.xml" ist nur ein Index, der auf 4 andere Sitemaps verweist. Wenn eine dieser tatsächlichen Sitemaps direkt auf der geklonten Site angefordert wird, werden sie korrekt geklont und die URLs aktualisiert. Ich hätte jedoch gesagt, dass diese Sitemaps aufgrund der anfänglichen Weiterleitung von "sitemap.xml" wahrscheinlich nicht auf der geklonten Site gefunden werden. (?) Obwohl, wenn sie "sitemap_index.xml" direkt übermitteln würden, würde dies offensichtlich die Umleitung umgehen.

— Herr weiß
quelle

Ich habe vor wenigen Minuten eine Anfrage an die Sitemap gestellt, und es gibt eine 301-Weiterleitung von der Spam-Site zur ursprünglichen Site.

— Schranknoc

@closetnoc Ah ja! Das habe ich schon mal vermisst. "sitemap.xml" ist eigentlich auch eine Weiterleitung auf der ursprünglichen Site ... es leitet zu "sitemap_index.xml" weiter. Die Spam-Site scheint diese Weiterleitung zu klonen, wodurch der Benutzer zur ursprünglichen Site zurückgeschickt wird! Wenn Sie eine der 4 in "sitemap_index.xml" aufgeführten Sitemaps direkt auf der Spam-Site anfordern, klont die Spam-Site sie korrekt. Aufgrund der anfänglichen Weiterleitung würde ich jedoch vermuten, dass sie schwer zu finden sind, es sei denn, sie wissen, dass sie gesendet werden müssen "sitemap_index.xml" anstelle von "sitemap.xml". Ich habe die Antwort aktualisiert. Vielen Dank.

— MrWhite

Wenn die Website Backlinks zu Ihnen erstellt, ist es wichtig, das Google Disavow-Tool zu verwenden, da sonst der Algorithmus unabhängig davon gegen Sie arbeitet.

https://www.google.com/webmasters/tools/disavow-links-main

Erstellen Sie eine TXT-Datei und fügen Sie Folgendes hinzu:

domain:thedamnsitethatcloned.com

Laden Sie es dann über die Webmaster-Tools zu Google hoch.

Hier sind genau die Schritte, die ich unternehmen würde, um dieses Problem zu beheben. Ich weiß, dass viele Webmaster mit diesem Problem konfrontiert sind. Ich hatte dieses Problem schon einmal und es scheint (ironischerweise) keine eindeutige Antwort auf Google zu geben (weshalb ich helfen möchte). Matt Cutts ist der Typ, dem Sie über diese Themen zuhören sollten, aber ihm zuzuhören ist wie der Versuch, eine Schachpartie gegen einen Supercomputer in einem brennenden Haus zu gewinnen (keine Hilfe zu finden).

Die kurzen Schnitte:

Registrieren Sie sich bei DMCA und setzen Sie das Abzeichen auf Ihre Website.
Sammeln Sie alle kopierten Inhalte, indem Sie die ersten 60 Wörter Ihrer Website in Google und Submut VIA https://www.google.com/webmasters/tools/dmca-dashboard einfügen. DMCA-Anfragen akzeptieren nur Permalinks.
Verweigern Sie JEDE Site, die Inhalte kopiert hat, die auf Sie zurück verlinken. Tun Sie dies auf jeder Seite Ihrer Website.

Meine erste Antwort war, die Domain zu disavowieren, aber ich habe vergessen zu erwähnen, dass Sie disavowieren müssen:

www. UND
nicht www.

(Google zählt sie als zwei separate Domains).

— John
quelle