Ich habe wget verwendet, um HTML-Dateien herunterzuladen. Wo werden die Bilder in der Datei gespeichert?


15

Firefox wurde sehr langsam wgetgeladen , daher habe ich beschlossen, HTML-Dateien zu speichern. Ich habe den folgenden Befehl verwendet:

wget http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Die Dateien wurden in meinem Home-Ordner gespeichert. Ich weiß jedoch nicht, wo die Bilder gespeichert sind. Ich benötige sie für die Verwendung in Anki.

Wo werden die Bilder gespeichert?


In diesem Artikel werden die Optionen und ihre Nützlichkeit erläutert.
Wilf

Antworten:


34

Ich bevorzuge es, --page-requisites( -pkurz) anstelle von -rhier zu verwenden, da hier alles heruntergeladen wird, was auf der Seite angezeigt werden soll, aber keine anderen Seiten. Außerdem muss ich mir keine Gedanken darüber machen, welche Art von Dateien ich haben möchte.

Eigentlich benutze ich normalerweise sowas

wget -E -H -k -p http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Das heisst:

  • -E: .htmlAn den Dateinamen anhängen , wenn es sich um eine HTML-Datei handelt, die jedoch nicht auf .htmlo.ä. endet
  • -H: Laden Sie auch Dateien von anderen Hosts herunter
  • -k: Konvertieren Sie nach dem Herunterladen alle darin enthaltenen Links, sodass sie auf die heruntergeladenen Dateien verweisen
  • -p: Laden Sie alles herunter, was die Seite für die ordnungsgemäße Offline-Anzeige benötigt

Ich kam hier suchen -H, und war glücklich darüber zu erfahren , -Eund -kauch. Vielen Dank!
Charles Clayton

2

Die Verwendung des Parameters -r sollte es wget ermöglichen, den gesamten Ordner einschließlich Ihrer Bilder herunterzuladen.

wget -r http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

2

Laden Sie die Bilddateien auch separat herunter

Ich denke, mit diesem Befehl können Sie loslegen.

 wget -r -P /save/location -A jpeg,jpg,bmp,gif,png http://textbook.s-anand.net/ncert/class-xii/chemistry/hello-this-first-chapter

Hier können Sie den Speicherort für die Bilder und die gewünschten Dateitypen angeben. Möglicherweise ist das Herunterladen der Bilder als solche einfacher.

Quelle :

-r aktiviert den rekursiven Abruf. Weitere Informationen finden Sie unter Rekursiver Download.

-P legt das Verzeichnispräfix fest, in dem alle Dateien und Verzeichnisse gespeichert werden.

-A Setzt eine Whitelist, um nur bestimmte Dateitypen abzurufen. Zeichenfolgen und Muster werden akzeptiert, und beide können in einer durch Kommas getrennten Liste verwendet werden (siehe oben). Weitere Informationen finden Sie unter Dateitypen.

Kopieren Sie die Bilddateien aus Ihrem Ordner

Ich habe festgestellt, dass die Website PNG-Bilddateien verwendet. Sie können diese einfach aus Ihrem Ordner kopieren. Dies sollte in dem Ordner ausgeführt werden, in dem Sie die Webseite gespeichert haben.

find . -name "*.png" -exec cp '{}' ./some_dir/somewhere/ \;

1

Wget lädt einfach die HTML-Datei der Seite herunter, nicht die Bilder auf der Seite, da die Bilder in der HTML-Datei der Seite als URLs geschrieben sind. Um zu tun, was Sie wollen, verwenden Sie -Rdie -AOption (rekursiv), die Option mit den Bilddateisuffixen, die --no-parentOption, damit es nicht aufsteigt, und die --levelOption mit 1.

Speziell wget -R -A .jpg,.png,.gif --no-parent --level <url>

Darüber hinaus bieten die meisten Browser Methoden zum Speichern von Seiten für die Offline-Anzeige .

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.