Wie gehe ich mit doppelten Inhalten / URLs in Joomla um?


11

Ich habe gerade ein großes SEO-Problem herausgefunden und habe es vorerst gelöst. Ich versuche herauszufinden, warum es überhaupt aufgetreten sein könnte und ob es einen Fehler gab oder ob es etwas mit Joomla selbst zu tun hat. Zuerst das Problem:

Als ich eine Site mit Moz gecrawlt habe, wurden vier doppelte Inhalte für die Homepage angezeigt, was unerwartet war. So wurden beispielsweise für die Homepage http://www.foo.com doppelte Inhalts-URLs wie die folgenden angezeigt:

foo.com/2-uncategorised/1-offers (canonical = foo.com/2-uncategorised/1-offers)
foo.com/2-uncategorised/2-enquiry (canonical = foo.com/2-uncategorised/2-enquiry) 
foo.com/2-uncategorised/3-products (canonical = foo.com/2-uncategorised/3-products) 

Und all diese Links haben einfach den Inhalt der Homepage geladen, aber die Metadetails stammen aus dem Artikel. Dies zeigte offensichtlich an, dass Joomla die Links automatisch erstellte und ich fand das gleiche für die 4 Links. Der Link im Artikel war wie folgt:

index.php?option=com_content&view=article&id=1&catid=2&Itemid=1
index.php?option=com_content&view=article&id=2&catid=2&Itemid=1
index.php?option=com_content&view=article&id=3&catid=2&Itemid=1

Das Itemid = 1entspricht dem Menüpunkt Homepage, der erklärt, warum die Homepage geladen wurde. Ich habe versucht, das Problem neu zu erstellen, konnte es aber nicht. Laut den Leuten, die den Inhalt hinzugefügt haben, sind hier die Schritte, die sie beim Erstellen dieser Artikel und Links darin ausgeführt haben:

  1. Artikel erstellen
  2. Fügen Sie über die Registerkarte "Artikel" im Inhaltseditor einen Link zu anderen Artikeln hinzu.
  3. Erstellen Sie einen Menüpunkt zu den Artikeln

Also habe ich mich gefragt, ob hier offensichtlich etwas nicht stimmt. Ich bin verwirrt, weil es über 100 Artikel gibt, aber dies geschah nur in ungefähr 5 Artikeln. Vielen Dank.

Antworten:


15

Inhaltsverzeichnis dieser Antwort:

  1. Inhalt unter derselben Artikel-ID
  2. So werden doppelte Inhalte erstellt / Dynamische Seiten / URLs
  3. SEO Perspektive
  4. Umgang mit doppelten Inhalten in Joomla
  5. Referenzen und Links

1. Warum die Artikel unter derselben Artikel-ID angezeigt werden

Erstens ist dies nicht das Problem, warum Sie doppelte URLs erhalten. Die Artikel verwenden die Artikel-ID der Homepage, da ihnen keine andere Artikel-ID zugewiesen ist.

Lesen Sie dazu mehr:

Und dieser könnte auch aufschlussreich sein:



2. Wie "doppelter Inhalt" erstellt wird / Dynamische Seiten / URLs

Dies ist eigentlich ein Standardverhalten für dynamische Websites, die ihre Seiten mithilfe von URL-Parametern generieren , um Abfragezeichenfolgen in Form von Feld-Wert- Paaren zu erstellen . Der Server / die Anwendung empfängt die Abfrage, verarbeitet sie und gibt den assoziativen Inhalt an den Browser zurück.

Um dies besser zu verstehen, möchten Sie möglicherweise SEF-URLs auf einer Joomla-Website deaktivieren und die Nicht-SEF-URL einer Seite ein wenig studieren:

Beispiel:

index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101

Aufteilen der obigen Abfrage in Feld-Wert-Paare sehen wir:

  • option = com_content
  • Ansicht = Artikel
  • id = 3
  • catid = 9
  • Itemid = 101

Dies sind Feldwerte, die Joomla versteht und versuchen wird, den folgenden Inhalt wie folgt zurückzugeben:

Es fragt in der Komponente com_content ab und verwendet eine Artikelansicht, um das Inhaltselement (Artikel) mit der ID 3 der Kategorie-ID 9 unter Verwendung des Menüelements mit der ID 101 anzuzeigen.


Viele URL-Variationen für 1 Seite

Derselbe Artikel kann jedoch mit noch mehr Feld-Wert-Kombinationen angezeigt werden:

Einige mögliche Kombinationen könnten sein:

  • index.php? option = com_content & view = article & id = 3 & catid = 9
  • index.php? option = com_content & view = article & id = 3 & Itemid = 101
  • index.php? option = com_content & view = article & id = 3 & Itemid = 102
  • index.php? option = com_content & view = article & id = 3 & Itemid = 103
  • index.php? option = com_content & view = article & id = 3
  • index.php? option = com_content & view = article & id = 3 & lang = en
  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = en

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = de & print = 1

  • index.php? option = com_content & view = article & id = 3 & catid = 9 & Itemid = 101 & lang = en & tmpl = component

Wie Sie sehen können, fordern alle oben genannten Daten dieselben Daten vom System an. Dies ist der Artikel mit der ID = 3. Dies führt dazu, dass auf denselben Inhalt / dieselbe Seite über verschiedene URLs zugegriffen werden kann und in einigen Fällen auch in verschiedenen Layouts angezeigt.

* Wenn SEF-URLs in Joomla aktiviert sind, kann dies möglicherweise zu mehr als einer SEF-URL für denselben Artikel / Inhalt führen.



3. Die SEO-Perspektive

Insbesondere moderne Suchmaschinen und Google sind sich dieses Verhaltens bewusst. Normalerweise werden sie ihr Bestes geben, um die am besten geeignete URL für eine Seite zu indizieren und in ihren Suchergebnissen zu behalten. Darüber hinaus hat Google festgestellt, dass es aufgrund dessen keine tatsächliche " Strafe " für doppelte Inhalte gibt.

Das Hauptproblem für den Fall, dass derselbe Inhalt / dieselbe Seite mehr als einmal indiziert wurde, besteht jedoch darin, dass Sie möglicherweise das Seitenranking und die bestmögliche SEO-Leistung verlieren , da das Seitenranking in mehr als 1 Seite anstelle von 1 aufgeteilt wird .

In diesem Sinne ist es ratsam, sich damit zu befassen, anstatt die Suchmaschinen die URLs indizieren zu lassen, während sie versuchen zu erraten, ob verschiedene URLs denselben oder unterschiedliche Inhalte anzeigen.
Darüber hinaus kann die Kontrolle Ihrer URLs und der Indexierung von SE zu einer besseren Benutzererfahrung insgesamt beitragen, da Website-Benutzer dieselbe Seite nur unter einer Standard-URL finden und eine solide Struktur für eine Website und deren Verwaltung erstellen können .



4. Umgang mit doppelten Inhalten

  • Verwenden kanonischer URLs für Ihre Seiten.
    Canonical Urls weist die Suchmaschine an, welche URL die richtige URL einer Seite sein soll, die sie crawlen und in ihrem Index behalten soll.

  • Verwenden Sie INDEX / NOINDEX, FOLLOW / NOFOLLOW-Metadaten. Wenn Sie solche Metadaten auf Ihren Seiten verwenden, werden Suchmaschinen angewiesen, ob sie den Inhalt einer Seite indizieren oder nicht und den darauf gefundenen Links folgen oder nicht.

  • Verwenden von 301 Weiterleitungen / htaccess.
    Sie können alle anderen URLs auf die gewünschte URL umleiten. Dies kann mit SEF Extensions oder htaccess erreicht werden . Beide bieten eine große Leistung, jedoch bietet htaccess eine große Flexibilität, da reguläre Ausdrücke für alle Arten von Umleitungen / oder Umschreibungen mit mod_rewrite verwendet werden können. In Bezug auf J-Erweiterungen verwende ich normalerweise sh404SEF , wenn dies erforderlich ist .

    Update: Wie @Neil Robertson in den Kommentaren feststellte: Eine wichtige Umleitung erfolgt von der Nicht-WWW-Version der Website zur WWW-Version der Website oder umgekehrt. Fügen Sie dies der .htaccess-Datei für die Umleitung von Nicht-WWW zu WWW hinzu.

        ### Redirect non-www to www
        RewriteCond %{HTTP_HOST} !^www\. [NC]
        RewriteRule ^(.*)$ http://www.%{HTTP_HOST}/$1 [R=301,L]
        ### Redirect non-www to www - END 
    
  • Verwenden der Google Webmasters Tools Die
    Google Webmasters Tools bieten Optionen zum Anpassen des Verhaltens des Crawlers mit Ihren URL-Parametern .

  • Verwenden von Sitemaps
    Übermitteln Sie die URL-Struktur Ihrer Site an die Suchmaschinen.

  • Verwenden der Robots.txt-Datei
    Google und andere wichtige SE respektieren Ihre Robots.txt. Sie können sie anweisen, bestimmte Verzeichnisse / URL-Pfade nicht zu crawlen.

Alle oben genannten Optionen können kombiniert werden, um das gewünschte Ergebnis zu erzielen.

* Wie überall tragen auch in Joomla eine gute Planung und Inhaltsorganisation immer dazu bei, ein besseres Ergebnis zu erzielen. Insbesondere bei Joomla beinhaltet dies auch eine saubere Kategorisierung der Inhalte und eine Struktur der Menüelemente.



5. Verweise und Links

Joomla SEO-Erweiterungen

Wenn Sie in Joomla effizient damit umgehen möchten, installieren Sie normalerweise eine SEO-SEF-Erweiterung eines Drittanbieters.



Lesen Sie mehr:


1
eine der besten Antworten in diesem Forum :) sehr hilfreich. danke @FFrewin
Joomler

1
Dies ist eine ausgezeichnete Antwort. :) Der Vollständigkeit halber kann es hilfreich sein, einige Informationen zum Umleiten der Nicht-WWW-Version der Website zur WWW-Version der Website hinzuzufügen oder umgekehrt. Dies wird oft vergessen, ist aber wahrscheinlich die Hauptursache für doppelte Inhalte auf allen Websites (nicht nur Joomla).
Neil Robertson

Es sieht so aus, als würde der neue Router in Joomla 3.8 endlich das Licht der Welt erblicken. Dies wird dazu beitragen, URLs zu vereinfachen, ohne dass eine Erweiterung eines Drittanbieters erforderlich ist.
Neil Robertson

1
@NeilRobertson: Ich denke immer noch, dass noch Verbesserungspotenzial besteht und weitere Arbeiten erforderlich sind, um eine vollständige und effiziente Lösung für die Verwaltung von SEF-URLs / -Duplikaten in Joomla zu finden.
FFrewin

@Frewin Ich stimme zu. Es sieht so aus, als müssten einige Erweiterungen von Drittanbietern möglicherweise ebenfalls aktualisiert werden, um den neuen Router nutzen zu können.
Neil Robertson

0

Wenn mehrere Menüelemente zum selben Inhalt gehören, verwende ich Systemlinks / Menüelement-Alias ​​im Menü-Manager. Hier ist ein alter Artikel darüber; Die Methode existiert jedoch noch heute: https://magazine.joomla.org/issues/issue-apr-2016/item/2997-avoid-duplicate-content-with-a-menu-item-alias

@Neil, ich stimme zu 100% zu, dass Nicht-WWW- oder WWW-Inhalte als Duplikate gelesen werden. Hier ist der Code, der www zwingt, nicht www zu sein. Legen Sie es in Ihre htaccess-Datei. Außerdem wird das https-Sicherheitsprotokoll hinzugefügt. Dieser Code ist nicht die einzige Methode, aber ich verwende sie erfolgreich auf vielen Websites.

RewriteCond %{HTTP_HOST} ^www.yourwebsite.com [NC]
RewriteRule ^(.*)$ https://yourwebsite.com/$1 [L,R=301]
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.