Was sind die besten Optionen für das Web-Scraping eines derzeit nicht geöffneten Tabs in einer Google Chrome-Erweiterung mit JavaScript und den verfügbaren Technologien ? Andere JavaScript-Bibliotheken werden ebenfalls akzeptiert.
Das Wichtigste ist, das Scraping so zu maskieren, dass es sich wie eine normale Webanforderung verhält . Keine Hinweise auf AJAX oder XMLHttpRequest, wie X-Requested-With: XMLHttpRequest
oder Origin
.
Der abgekratzte Inhalt muss über JavaScript zugänglich sein, damit er innerhalb der Erweiterung weiter bearbeitet und dargestellt werden kann, höchstwahrscheinlich als Zeichenfolge.
Gibt es Hooks in einer WebKit / Chrome-spezifischen API: s, mit denen eine normale Webanforderung gestellt und die Ergebnisse für die Manipulation abgerufen werden können?
var pageContent = getPageContent(url); // TODO: Implement
var items = $(pageContent).find('.item');
// Display items with further selections
Bonuspunkte, damit dies aus einer lokalen Datei auf der Festplatte für das erste Debugging funktioniert . Aber wenn dies der einzige Punkt ist, der eine Lösung stoppt, ignorieren Sie die Bonuspunkte.