Warum indiziert Google Seiten mit der Abfragezeichenfolge? Utm_campaign?


9

Kürzlich habe ich festgestellt, dass Google URLs indiziert, die Argumente für die Abfragezeichenfolgen utm_campaign, utm_source und utm_medium enthalten. In den Ergebnissen zeigt Google URLs mit diesen Abfragezeichenfolgen anstelle der kanonischen URL an:

utm_campaign zur URL hinzugefügt

Ich verstehe, dass dies ein Problem mit "doppeltem Inhalt" sein könnte, aber ich habe das link rel=canonicalTag auf meiner gesamten Website verwendet. Als ein Beispiel:

[snip]
<meta name="description" content="App store optimization helps discovery and rank on Google Play and the App Store. Publishers can use ASO by following these simple steps."/>
<meta name="robots" content="noodp"/>
<link rel="canonical" href="https://sweetpricing.com/blog/2016/11/app-store-optimization/" />
<meta property="og:locale" content="en_US" />
[snip]

Screenshot des kanonischen Tags

Ich gehe davon aus, dass Google die kanonische URL für die Indizierung verwenden sollte. Was mache ich falsch?


2
Auch ohne das kanonische Tag ignoriert Googlebot normalerweise UTM-Parameter, da es weiß, dass sie nur zum Verfolgen verwendet werden. Ich habe sie noch nie indiziert gesehen, besonders nicht mit einem Kanon.
Stephen Ostermiller

4
FWIW site:stackexchange.com inurl:utm_campaignliefert auch ähnliche Ergebnisse (in etwas größerem Maßstab). Beachten Sie auch, dass site:Suchvorgänge häufig nicht-kanonische URLs in den Ergebnissen zurückgeben, die normalerweise bei "normalen" Suchvorgängen nicht zurückgegeben werden. Die oben genannten URLs scheinen jedoch auch bei "normalen" Suchvorgängen zurückgegeben zu werden.
MrWhite

Antworten:


3

Wenn ich Ihre Website so überprüfe, wie sie jetzt ist, bin ich mir nicht sicher, ob dies länger / aktuell ein Problem ist.

Das Problem ist keine interne Verknüpfung auf Ihrer Website unter Einbeziehung von UTM-Parametern (wie eine andere Frage nahelegt).

Es scheint eher so, als ob ein Prozess, den Sie zum Teilen Ihres Website-Inhalts in sozialen Medien durchführen müssen, darin besteht, die UTM-Parameter in den URLs zu belassen und diese URLs zu teilen, was irgendwann dazu geführt hat, dass sie indiziert wurden.

Es ist selten, dass dies passiert, aber es ist schon vielen anderen Websites passiert. Die Tatsache, dass nur drei Seiten mit diesen Parametern indiziert sind, weist darauf hin, dass dies weder ein ernstes noch ein allgemeines Problem ist.

Hier sind die Schritte, die Sie unternehmen können, um dies zu verhindern: -

1. Geben Sie auf Ihren Seiten eine kanonische URL an

Sie tun dies bereits und die Implementierung ist korrekt. Dadurch wird sichergestellt, dass nur die angegebene kanonische URL in Suchmaschinen gewichtet wird. Vermutlich war dies immer der Fall, aber wenn nicht, könnte dies erklären, warum es einige alte Instanzen von Seiten gibt, die noch mit UTM-Parametern indiziert sind.

Richtige Implementierung kanonischer URLs

2. Weisen Sie Google an, die UTM-Parameter in der Suchkonsole nicht zu indizieren

Für den Fall, dass einige URLs mit den UTM-Parametern indiziert werden (wie in Ihrem Fall), sollte der URL-Parameter im Abschnitt "Crawlen> URL-Parameter" der Google Search Console für Ihre Domain als erkannt angezeigt werden (siehe unten).

UTM-URL-Parameter der Google Search Console

Auch wenn die UTM-Parameter nicht angezeigt werden, können Sie sie mit 'Parameter hinzufügen' erstellen.

Wählen Sie einfach No: Doesn't affect page content (ex: tracks usage)(als "Passive Parameter" bezeichnet) und Google crawlt dann normalerweise nur eine URL mit einem bestimmten Parameterwert .

3 Lassen Sie die URL-Parameter in Ihrer robots.txt nicht zu

Dadurch wird Google daran gehindert, den Inhalt dieser URLs zu indizieren, nicht jedoch die tatsächlichen URLs selbst (sie könnten weiterhin in den Suchergebnissen angezeigt werden, lassen jedoch die Beschreibung wie unten weg).

Indizierte Seite in robots.txt nicht zulässig

Einfach das Hinzufügen dieser so etwas wie die folgenden würde Griff aus robots.txt: -

Disallow: /*?utm=*

Fazit

Die Schritte 1 und 2 sollten ohnehin als Vorsichtsmaßnahme und "Best Practice" und Schritt 3 zusätzlich zu den Schritten 1 und 2 ausgeführt werden (da sie für sich genommen nicht wirksam sind).

In der Google Search Console besteht auch die Möglichkeit, URLs (vorübergehend) zu entfernen. Dies ist besonders nützlich, wenn einige hartnäckige Seiten noch indiziert sind, Sie jedoch wissen, dass die Hauptursache des Problems behoben wurde und diese Funktion ausreichen sollte, um sie ein für alle Mal aus den Suchergebnissen zu entfernen.

Ich habe dies nicht als obigen Schritt aufgenommen, da ich mich trotz vorheriger Recherche nicht erinnern kann, ob es URLs mit Parametern unterstützt [Zitieren erforderlich]. Ich wusste einmal die Antwort, aber mein Gedächtnis versagt mir bei dieser besonderen Gelegenheit.

Weitere Informationen zum Entfernen von URLs aus Google .


1
Aber wenn Sie diese URLs von Wesen blockieren gekrochen mit robots.txt(# 3) , dann werden Sie nicht auch diese Kampagnen blockieren , werden verfolgt ? ... und auch verhindern, dass das kanonische Tag auf der Seite gelesen wird (# 1)?
MrWhite

Ich stimme dem zu, was w3dk über robots.txt sagt. Wenn irgendetwas noindex: /*?utm=*in robots.txt verwenden.
Stephen Ostermiller

2

Es scheint, dass Sie diese Links im Inhalt Ihrer Website verwenden, um Seiten miteinander zu verknüpfen.

Um sicherzustellen, dass Google nicht indiziert, können Sie rel="nofollow"diese Links auf Ihrer Website hinzufügen und diese Parameter aus der robots.txt-Datei blockieren:

Disallow : /*utm_campaign

Guter Fang, dass sie für interne Links verwendet werden. Dies würde den Unterschied zu den meisten Websites erklären, auf denen sie im Allgemeinen nur für eingehende Links verwendet werden.
Stephen Ostermiller

Tatsächlich werden die URLs von utm_campaign von Buffer.com hinzugefügt - z. B. sehen sie wie "utm_source = plus.google.com & utm_campaign = buffer" aus. Ich glaube nicht, dass ich diese Links irgendwo auf der Website verwende.
Brendon

1

Haben Sie überprüft, ob Ihre kanonische URL indiziert wurde oder nicht? Wenn die kanonische URL indiziert wurde, besteht kein Grund zur Sorge.

Sie können die Webmaster-Tools von Google ausprobieren und hier ändern, wie Google mit URL-Parametern umgeht .


1
Bei einigen URLs wird nur die URL utm_campaign indiziert. Bei anderen Seiten wurden beide URLs im Index angezeigt. Gestern habe ich das Abrufen als Google-Tool verwendet, um eine URL (mit der Abfragezeichenfolge utm_campaign) zu crawlen. Diese URL scheint nun verschwunden zu sein, und die kanonische URL ist jetzt indiziert.
Brendon

Außerdem scheinen die Crawling-Statistiken ( Screenshot ) Seiten anzuzeigen, deren Crawlen lange dauert (durchschnittlich 2,3 Sekunden). Ich bin nicht sicher, ob dies ein weit verbreitetes Problem ist, aber möglicherweise hat Google Probleme beim Crawlen der Website.
Brendon

Sie können auch eine kleine Bereinigung durchführen, sobald ein Besucher auf Ihrer Website landet. Verwenden Sie das Link Fresh URL-Skript, um alle UTM-Parameter dynamisch aus der URL zu entfernen, nachdem Sie davon profitiert haben. Zweitens fügen Sie URL-Parameter hinzu ...
Muhammad Usman
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.