Mit einem Webbrowser (IE oder Chrome) kann ich eine Webseite (.html) mit Ctl-S speichern, sie mit einem beliebigen Texteditor überprüfen und Daten in einem Tabellenformat anzeigen. Eine dieser Zahlen möchte ich extrahieren, aber für viele, viele Webseiten zu viele, um sie manuell auszuführen. Daher möchte ich WGET verwenden, um diese Webseiten nacheinander abzurufen, und ein anderes Programm schreiben, um die .html-Datei zu analysieren und die gewünschte Nummer abzurufen. Die von WGET unter der gleichen URL wie der Browser gespeicherte HTML-Datei enthält jedoch keine Datentabelle. Warum nicht? Es ist, als ob der Server erkennt, dass die Anforderung von WGET und nicht von einem Webbrowser stammt, und eine Hauptwebseite ohne Datentabelle bereitstellt. Wie kann ich mit WGET genau dieselbe Webseite erreichen? - Danke!
MEHR INFO:
Ein Beispiel für die URL, die ich abzurufen versuche, ist: http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=en-US wobei die Zeichenfolge ICENX ein Symbol für einen Investmentfonds-Ticker ist , die ich zu einem von mehreren verschiedenen Tickersymbolen ändern werde. Dadurch wird eine Datentabelle heruntergeladen, wenn sie in einem Browser angezeigt wird. Die Datentabelle fehlt jedoch, wenn sie mit WGET abgerufen wird.