Website Wordcount mit WGET


1

Ich würde gerne wissen, ob es möglich ist, mit wget eine ganze Website zu zählen.

Hat das schon jemand ausprobiert?

Folgendes habe ich bisher gefunden:

wget -q -O- http://www.website.com | grep -c .

Du meinst die tatsächliche Wortzahl? Oder möchten Sie auch die Meta-Wörter wie Tags, Attribute, Titel usw. zählen?
M'vy

ja nur der inhalt
mnml

Dann benötigen Sie einen HTML-Parser, der Eingaben von stdin verarbeiten kann. Kenne keinen Geldautomaten.
M'vy

Antworten:


1

wget -q -r -O- http://www.example.com | wc -l

Wenn die Site jedoch nicht statisch ist, kennwortgeschützte Bereiche aufweist oder Formulare enthält, können Sie nicht alle problemlos abrufen.

Wenn Sie alle Wörter zählen müssen, sagen Sie Amazon, müssen Sie möglicherweise die Kreditkarte aufladen, die Ihrem Ein-Klick-Konto zugeordnet ist :-)

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.