Wikipedia bietet das folgende Beispiel für die Beschreibung von Feature-Hashing . Die Zuordnung scheint jedoch nicht mit dem definierten Wörterbuch übereinzustimmen
Zum Beispiel to
sollte 3
entsprechend dem Wörterbuch konvertiert werden , aber es wird 1
stattdessen als codiert .
Gibt es einen Fehler in der Beschreibung? Wie funktioniert Feature-Hashing?
Die Texte:
John likes to watch movies. Mary likes too. John also likes to watch football games.
kann mit dem Wörterbuch konvertiert werden
{"John": 1, "likes": 2, "to": 3, "watch": 4, "movies": 5, "also": 6, "football": 7, "games": 8, "Mary": 9, "too": 10}
zur Matrix
[[1 2 1 1 1 0 0 0 1 1] [1 1 1 1 0 1 1 1 0 0]]