Ich möchte, dass Google URLs wie diese ignoriert:
http://www.mydomain.com/new-printers?dir=asc&order=price&p=3
Alle URLs mit den Parametern dir, order und price sollten ignoriert werden, aber ich habe keine Erfahrung mit Robots.txt.
Irgendeine Idee?
Ich möchte, dass Google URLs wie diese ignoriert:
http://www.mydomain.com/new-printers?dir=asc&order=price&p=3
Alle URLs mit den Parametern dir, order und price sollten ignoriert werden, aber ich habe keine Erfahrung mit Robots.txt.
Irgendeine Idee?
Antworten:
Hier ist eine Lösung, wenn Sie Abfragezeichenfolgen nicht zulassen möchten:
Disallow: /*?*
oder wenn Sie Ihre Abfragezeichenfolge genauer beschreiben möchten:
Disallow: /*?dir=*&order=*&p=*
Sie können der robots.txt auch hinzufügen, welche URL zugelassen werden soll
Allow: /new-printer$
Das $wird sicherstellen, dass nur das /new-printererlaubt ist.
Mehr Info:
http://code.google.com/web/controlcrawlindex/docs/robots_txt.html
http://sanzon.wordpress.com/2008/04/29/advanced-usage-of-robotstxt-w-querystrings/
/new-printeraber nicht zulassen /new-printers?dir=*&order=*&p=*??
Sie können diese spezifischen Abfragezeichenfolgenparameter mit den folgenden Zeilen blockieren
Disallow: /*?*dir=
Disallow: /*?*order=
Disallow: /*?*p=
Also , wenn eine URL enthält dir=, order=oder p= irgendwo in dem Abfrage - String, wird er gesperrt.
example.com?p=testsondern auch example.com?top=test.
Disallow: /*?dir=* Disallow: /*?order=* Disallow: /*?p=* Disallow: /*&dir=* Disallow: /*&order=* Disallow: /*&p=*
Registrieren Sie Ihre Website bei Google WebMaster Tools. Dort können Sie Google mitteilen, wie mit Ihren Parametern umgegangen werden soll.
Site-Konfiguration -> URL-Parameter
Auf den Seiten, die diese Parameter enthalten, sollte angegeben werden, dass sie über das Robots-Meta-Tag von der Indizierung ausgeschlossen werden sollen. z.B