Warum sollte ich Wget anstelle eines Browsers verwenden? [geschlossen]


15

In welchem ​​Fall sollte ich lieber Wget als einen Browser verwenden?

Ich habe gehört, dass Richard Stallman es aus Gründen der Anonymität anstelle eines Browsers verwendet. Und was sieht der Server, wenn Sie seine Dateien mit Wget erhalten?


3
Wenn ich zum Beispiel nur eine Datei herunterladen muss, warum sollte ich dann Ressourcen verschwenden, um einen ganzen Browser zu öffnen? Wo haben Sie gehört, dass Stallman wgetaus "Sicherheitsgründen" verwendet?
Edwinksl

3
Hier gibt es mindestens vier Fragen: 1. Was sind die Vorteile von wget gegenüber einem Browser? 2. Wie präsentiert sich wget einem Webserver? 3. Hat wget Datenschutzvorteile gegenüber einem Webbrowser? 4. Benutzt [Richard] Stallman wget, und wenn ja, ist es aus Anonymitätsgründen.
Ben Aveling

4
Nach diesem , wie ich tue , um meine Rechen Seite, Stallman etwas „viel wie wget“ verwendet: Abrufen Web - Seiten per E - Mail (aber er grafischen Browser nicht verwendet die abgerufenen Seiten zu öffnen, falls erforderlich); Außerdem surft er mit einem grafischen Browser über Tor im Internet, sodass das Abrufen per E-Mail nicht der einzige Weg ist.
oder

3
Bitte posten Sie die Quelle Ihrer Anhörung
Anwar,

3
«Und welcher Server denkt / sieht, wenn Sie seine Dateien mit Wget erhalten?» Er denkt: «Oh, das muss Stallman sein! Ich werde den Inhalt personalisieren, um mich mit ihm
anzulegen

Antworten:


25

Normalerweise würden Sie es niemals "anstelle eines Browsers" verwenden. Browser rendern HTML, machen Links anklickbar (anstatt die URL manuell in einen anderen wget-Befehl kopieren zu müssen) usw. Es gibt buchstäblich keinen Vorteil, wget als Mensch zu verwenden. Wenn Sie sich Gedanken über den Datenschutz machen, gibt es eine Million Möglichkeiten, einen Browser zu bereinigen (oder Sie können einen weniger nützlichen Browser wie Lynx verwenden, wenn Sie wirklich Barebones erhalten möchten, ohne den Anschein einer menschlichen Benutzeroberfläche zu zerstören).

Wget wird hauptsächlich verwendet, wenn Sie eine schnelle, kostengünstige, skriptfähige / Befehlszeilen-Methode zum Herunterladen von Dateien benötigen. So können Sie beispielsweise wget in ein Skript einfügen, um eine Webseite herunterzuladen, die häufig mit neuen Daten aktualisiert wird. Dies ist etwas, wofür ein Browser nicht wirklich verwendet werden kann. Sie können die verschiedenen Optionen von wget verwenden, um eine Website zu crawlen und automatisch zu speichern, was die meisten Browser nicht können, zumindest nicht ohne Erweiterungen.

Kurz gesagt, Browser sind Anwendungen für Menschen, die ins Internet schauen. Wget ist ein Tool für Maschinen und Power-User, die Daten über HTTP übertragen. Sehr ähnlich, was sie tun (Dateien von Websites ziehen), aber völlig anders in ihrer Verwendung.

In Bezug darauf, was Server "sehen", wenn Sie Dinge mit wget erhalten: Alle HTTP-Clients (Browser, wget, curl, andere ähnliche Anwendungen) übertragen das, was als "User Agent" bezeichnet wird. Dies ist nur eine Zeichenfolge, die den Browser beschreibt (oder heutzutage). beschreibt, welche Browserfunktionen es hat). Dies kann verwendet werden, um je nach Browser des Nutzers unterschiedliche Inhalte anzuzeigen (z. B. versucht Google, Chrome nicht für Personen zu bewerben, die Chrome bereits verwenden). Einige Idioten versuchen, Power-User-Tricks zu blockieren, indem sie den User-Agent-String von wget blockieren, aber Sie können einfach einen Chrome-User-Agent-String fälschen, um das zu umgehen. Häufig wird es nur für Statistiken verwendet, damit Sie wissen, wie beliebt die verschiedenen Browser sind und welche Sie am gründlichsten testen müssen.

Wenn Sie die Crawling-Funktionen von wget verwenden, werden auf dem Server viele schnelle Anfragen in meist alphabetischer Reihenfolge angezeigt. Es ist ein totes Werbegeschenk, dass Sie ihre Website kratzen. Es sieht ganz anders aus als das Surfen eines Benutzers. Wenn ein menschlicher Benutzer Anforderungen in einem Browser vornimmt, werden nach jeder Seitenanforderung alle Bilder auf dieser Seite angezeigt, und es tritt eine Verzögerung auf. Anschließend wird eine andere zufällige Seite (oder möglicherweise eine Reihe von Seiten mit einem eindeutigen Zweck) angefordert. .


16

Wie bereits erwähnt, wgethat es den Vorteil, dass es nicht mit Add-Ons, Cookies und Cache gebündelt wird, wodurch es möglicherweise stabiler und sicherer wird. Aber Browser und haben wgeteigentlich ganz andere normale Verwendungsmöglichkeiten.

wgetist ein Befehlszeilenprogramm zum Abrufen von Inhalten, nicht zum Präsentieren von Inhalten. Es kann verwendet werden, um alles über FTP, HTTP und HTTPS abzurufen und herunterzuladen, einschließlich aller Dateitypen (HTML, Bilder, Binärdateien usw.).

Für den Server wird nur ein anderer Unterschied angezeigt, es user agentsei denn, Sie verwenden das --user-agentArgument, um den eines Browsers anzugeben. In diesem Fall sieht der Server keinen Unterschied.


5

1) Downloads, die eher von einem Skript als von einem Menschen initiiert wurden

2) Herunterladen ganzer Sites (oder Fragmente von Sites) anstatt einzelner Seiten. (Wget kann automatisch Links folgen.)

Wget verfügt über einige Befehlszeilenoptionen, mit denen gesteuert werden kann, was der Server sieht und was er denken kann, einschließlich willkürlicher Verzögerungen zwischen den Anforderungen zum Herunterladen von Seiten. Wenn der Standortserver jedoch über Anti-Bot-Richtlinien verfügt, verschwenden Sie häufig viel Zeit und Verkehr, bevor Sie ein akzeptables Ergebnis erzielen.


3) Download von einem Menschen initiiert, wenn es keinen leicht zugänglichen Browser gibt (zB über ssh)
Dezza

4

Wenn Sie einen Browser verwenden, ist alles in ihm aktiv, einschließlich unerwünschter Addons und sogar Malware, während wget ein einfacher Befehl ist, der Sachen herunterlädt und absolut nichts anderes tut.

Der Browser ist nicht unbedingt weniger sicher, aber möglicherweise auch.

Die Server "sehen" wie gewohnt eine Download-Anfrage.


4

Der Browser kann Ihre Aktivitäten in Verlaufs- und Cachedateien aufzeichnen.

wget hat keine speicherretention.

Das heißt, ein Browser ist praktischer und es ist mir egal, ob die NSA herausfindet, dass ich ihn 4.7.2-040702-genericletzte Woche heruntergeladen habe . Ich verwende meinen Browser für Online-Banking und Paypal, was vermutlich wichtiger ist als die meisten Dateien, die ich mit wget herunterladen kann.


2

Als Entwickler, der ferne Ubuntu-Installationen verwendet, macht es oft wenig Sinn, die OS-GUI zu installieren. In dieser Befehlszeilenumgebung ist wget ein wichtiges Tool zum Herunterladen von Dateien aus dem Web.

Ich bin mir nicht mal sicher, welche Browser, wenn überhaupt, vom Terminal aus ausgeführt werden können.


2
w3m ist ein großer Terminal Browser :) en.wikipedia.org/wiki/W3m
kalenpw

lynx ist ein weiterer lynx.browser.org
rviertel
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.