Ich habe eine HTML-Zeichenfolge und möchte herausfinden, ob ein von mir angegebenes Wort in dieser Zeichenfolge relevant ist.
Die Relevanz könnte anhand der Häufigkeit im Text gemessen werden.
Ein Beispiel zur Veranschaulichung meines Problems:
this is an awesome bike store
bikes can be purchased online.
the bikes we own rock.
check out our bike store now
Jetzt möchte ich ein paar andere Wörter testen:
bike repairs
dog poo
bike repairs
sollte als relevant markiert werden, während dog poo
nicht als relevant markiert werden sollte.
Fragen:
- Wie könnte das gemacht werden?
- Wie filtere ich mehrdeutige Wörter wie
in
oder heraus?or
Danke für deine Ideen!
Ich denke, es ist etwas, was Google tut, um herauszufinden, welche Keywords für eine Website relevant sind. Ich versuche im Grunde, ihre On-Page-Rankings zu reproduzieren.