Ich habe ein Unterverzeichnis, das ich vor den Suchmaschinen-Webcrawlern verstecken möchte.
Eine Möglichkeit, dies zu tun, ist die Verwendung von a robots.txtim Stammverzeichnis des Servers (die Standardmethode). Jeder, der die URL der Website kennt und über grundlegende Webkenntnisse verfügt, kann auf den Inhalt von robots.txt zugreifen und die unzulässigen Verzeichnisse aufspüren.
Ich habe mir überlegt, wie ich das vermeiden kann, bin mir aber nicht sicher, ob es funktionieren wird.
Sei Xder Name des Unterverzeichnisses, das ich ausschließen möchte. Eine Möglichkeit, die Indizierung des XVerzeichnisses durch Web Crawler zu stoppen und gleichzeitig die Identifizierung des XVerzeichnisses durch Root zu erschweren robots.txt, besteht darin, das robots.txtim XVerzeichnis anstelle des Root-Verzeichnisses hinzuzufügen .
Wenn ich dieser Lösung folge, habe ich folgende Fragen:
- Finden die Web Crawler das
robots.txtim Unterverzeichnis? (vorausgesetzt, es gibtrobots.txtbereits ein und auch im Stammverzeichnis) Wenn
robots.txtsich imXUnterverzeichnis befindet, sollte ich dann relative oder absolute Pfade verwenden ?:User-agent: * Disallow: /X/oder
User-agent: * Disallow: /