Welches Meta-Roboter-Tag wird bevorzugt?

Meine Frau arbeitet an einem Gymnasium in Deutschland. Ich habe kürzlich festgestellt, dass es extrem schwierig ist , die Homepage dieser Schule mit Google zu finden. Ich habe mir den Quellcode der Seite angesehen und glaube, ich habe den Grund gefunden: Es gibt zwei <meta name="robots">Tags; einer ist

<meta name="robots" content="all">

und der zweite weiter unten auf der Seite ist

<meta name="robots" content="noindex, follow">

Ich vermute, dass der zweite den ersten übertrifft und Google davon abhält, die Website zu indizieren. Habe ich recht? Ich möchte dem Webmaster nicht sagen, dass ich das Problem gefunden habe, und mich selbst zum Idioten machen (weil ich nicht wirklich weiß, wie man eine richtige Webseite erstellt, geschweige denn SEO macht).

Übrigens, wenn Sie zufällig andere Dummköpfe auf der Website finden, würde ich mich freuen, wenn Sie diese melden könnten. Mein nächster Kandidat wäre das völlige Fehlen relevanter metaTags, die Informationen über den Inhalt der Seite vermitteln.

seo web-crawlers meta-robots

— Tim Pietzcker
quelle

Die deutsche Wikipedia gibt an, dass dies <meta name="robots" content="all"> semantisch gleich ist <meta name="robots" content="index, follow">, sodass die beiden Meta-Tags in keiner Weise widersprüchlich sind. Ich würde den Webmaster benachrichtigen. Ich vermute auch, dass Google die strengere Richtlinie wählt und die Seite daher nicht indiziert, um Urheberrechtsprobleme zu vermeiden.

— Matthias Ronge

Ich habe auch gesehen, dass am Ende der Seite zwei Anfragen an Server von Drittanbietern ( ajax.googleapis.comund ssl.google-analytics.com) gesendet werden . Dies kann eine rechtliche Frage gegen das Privileg der informativen Selbstbestimmung in Deutschland sein. Ich würde empfehlen, das zu vermeiden.

— Matthias Ronge

Es gibt auch zwei titleElemente. Und das gleiche wird auf anderen Seiten wiederholt, nicht nur auf der Homepage! Tatsächlich scheint es keine indizierten Seiten zu geben, abgesehen von einer Handvoll PDFs!? Vielleicht widersprüchliche Module im CMS?! Ein kleines Nebenproblem ... Wie in den Antworten angegeben, wird die restriktivste Regel von den Suchmaschinen angewendet - nicht unbedingt die spätere Regel. Eine Funktion wie PHPs gibt get_meta_tags()jedoch nur die spätere Regel zurück. Daher besteht ein unmittelbares (potenzielles) Problem, wenn mehrere Meta-Tags für dieselben Daten vorhanden sind.

— MrWhite

@ w3d: Danke für die Einblicke! Das ist sehr hilfreich.

— Tim Pietzcker

Antworten:

Während die deutsche Wikipedia behauptet, dass dies allein gültiger Wert ist, habe ich keine Ahnung, woher diese Informationen stammen, und die deutsche Wikipedia zitiert keine Quelle. Es ist AFAIK falsch und meiner Meinung nach ein gutes Beispiel dafür, warum man sich bei dieser Art von Informationen nicht auf Wikipedia verlassen sollte.

Wenn Sie den Roboter - Meta - Tag direkt verwenden möchten Googlebot , die besten Informationen über die gültigen Werte ist Google zentrale Webmaster . Die folgenden sechs Werte werden als gültig aufgeführt : noindex, nofollow, noarchive, nosnippet, noodp, none.

Mit anderen Worten, für Googlebot :

meta name="robots" content="all">

ist ein Syntaxfehler und wird ignoriert, während:

<meta name="robots" content="noindex, follow">

ist eine gültige Syntax und wird eingehalten (dies erklärt, warum es extrem schwierig ist, die Homepage dieser Schule mit Google zu finden).

Um Ihre zweite Frage zu beantworten: Was passiert, wenn zwei gültige Roboter-Meta-Tags in Konflikt stehen, sagt Google (dieselbe Seite wie die oben verlinkte):

Wenn Inhaltswerte in Konflikt stehen, verwenden wir die restriktivsten.

In Bezug auf Meta-Tags finden Sie hier eine Übersicht über von Google erkannte Meta-Tags .

— Svartepjotr
quelle

Vielen Dank für den Link zu Google Webmasters Central. Ich werde das dem Webmaster der Schule geben.

— Tim Pietzcker

Die Meta-Tags des Roboters sind ausführlich unter developer.google.com/webmasters/control-crawl-index/docs/… dokumentiert. Der einfache Weg, sich daran zu erinnern, ist, dass die "positiven" (alle, index, follow) keine haben Wirkung überhaupt.

— John Mueller

Das Verhalten für zwei widersprüchliche Meta-Tags ist meines Wissens nicht definiert, aber höchstwahrscheinlich wird die restriktivste Regel gewinnen.

Dies geschieht im ähnlichen Fall zwischen der robots.txt-Datei und dem Meta-Robots-Tag. Wenn robots.txt die Indizierung einer Seite verhindert und Meta-Robots dies nicht tut, wird die Seite nicht indiziert. Und wenn robots.txt eine Seite zulässt, Meta-Robots sie jedoch blockiert, wird sie immer noch nicht indiziert.

Die Logik würde also vorschreiben, dass bei zwei widersprüchlichen Meta-Tags, wenn eines die Indizierung blockiert, das andere überschrieben wird (unabhängig von der jeweiligen Position auf der Seite).

Sie sollten den Webmaster fragen, ob er Suchmaschinen aus einem bestimmten Grund blockiert. Wenn nicht, entfernen Sie beide Meta-Tags (standardmäßig sind Suchmaschinen zulässig, sodass kein Grund besteht, das Tag überhaupt zu haben).

Was den anderen Teil Ihrer Frage betrifft, fallen Site-Überprüfungen nicht in den Bereich von Pro Webmasters. Aber ich werde hinzufügen, dass das Meta-Beschreibungs-Tag wahrscheinlich das einzige ist, das Sie nützlich finden werden. Das Meta-Keyword-Tag wird von keiner Suchmaschine verwendet.

— DisgruntledGoat
quelle