wget rekursiv auf untergeordnete Elemente des URL-Pfads beschränkt


10

Ich möchte die folgende Subdomain mit der rekursiven Option herunterladen, indem ich wget:

www.example.com/A/B

Wenn diese URL also Links zu www.example.com/A/B/Cund enthält www.example.com/A/B/D, sollten diese beiden ebenfalls heruntergeladen werden.

Ich möchte jedoch nicht, dass etwas außerhalb der www.example.com/A/BSubdomain heruntergeladen wird. Zum Beispiel, wenn www.example.com/A/B/Cein Link zu hat www.example.com, die Seite www.example.comsollte nicht heruntergeladen werden.

Welchen wgetBefehl soll ich verwenden?

Antworten:


9

Verwenden Sie die --no-parentOption in wget:

--no-parent

Steigen Sie beim rekursiven Abrufen niemals in das übergeordnete Verzeichnis auf. Dies ist eine nützliche Option, da dadurch garantiert wird, dass nur die Dateien unterhalb einer bestimmten Hierarchie heruntergeladen werden.


Ah, das ist was ich suche. Die wget-Optionen sind so zahlreich, dass ich sie nicht finden konnte. :)

2

Verwenden Sie die -IOption, um das Verzeichnis anzugeben, das in den Download aufgenommen werden soll:

wget -r -I www.example.com/A/B/C,www.example.com/A/B/D
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.