Ich habe ein Unterverzeichnis, das ich vor den Suchmaschinen-Webcrawlern verstecken möchte.
Eine Möglichkeit, dies zu tun, ist die Verwendung von a robots.txt
im Stammverzeichnis des Servers (die Standardmethode). Jeder, der die URL der Website kennt und über grundlegende Webkenntnisse verfügt, kann auf den Inhalt von robots.txt zugreifen und die unzulässigen Verzeichnisse aufspüren.
Ich habe mir überlegt, wie ich das vermeiden kann, bin mir aber nicht sicher, ob es funktionieren wird.
Sei X
der Name des Unterverzeichnisses, das ich ausschließen möchte. Eine Möglichkeit, die Indizierung des X
Verzeichnisses durch Web Crawler zu stoppen und gleichzeitig die Identifizierung des X
Verzeichnisses durch Root zu erschweren robots.txt
, besteht darin, das robots.txt
im X
Verzeichnis anstelle des Root-Verzeichnisses hinzuzufügen .
Wenn ich dieser Lösung folge, habe ich folgende Fragen:
- Finden die Web Crawler das
robots.txt
im Unterverzeichnis? (vorausgesetzt, es gibtrobots.txt
bereits ein und auch im Stammverzeichnis) Wenn
robots.txt
sich imX
Unterverzeichnis befindet, sollte ich dann relative oder absolute Pfade verwenden ?:User-agent: * Disallow: /X/
oder
User-agent: * Disallow: /