Ich fange gerade an zu lernen, wie ein neuronales Netzwerk Muster erkennt und Eingaben kategorisiert, und ich habe gesehen, wie ein künstliches neuronales Netzwerk Bilddaten analysieren und die Bilder kategorisieren kann ( Demo mit convnetjs ) und den Schlüssel dort wird das Bild heruntergemustert und jedes Pixel stimuliert ein Eingangsneuron in das Netzwerk.
Ich versuche jedoch, den Kopf herumzureißen, wenn dies mit Zeichenfolgen möglich ist. Der Anwendungsfall, den ich habe, ist eine "Empfehlungsmaschine" für Filme, die ein Benutzer gesehen hat. Filme haben viele String-Daten (Titel, Handlung, Tags), und ich könnte mir vorstellen, den Text auf ein paar Schlüsselwörter herunterzusampeln, die den Film beschreiben Denken Sie, ich brauche Eingabe-Neuronen für jedes englische Wort, um eine Reihe von Filmen zu vergleichen? Ich könnte die Eingabe-Neuronen nur auf die Wörter beschränken, die im Set verwendet werden, aber könnte es dann wachsen / lernen, indem neue Filme hinzugefügt werden (Benutzer sieht sich einen neuen Film mit neuen Wörtern an)? Die meisten Bibliotheken, die ich gesehen habe, erlauben es nicht, neue Neuronen hinzuzufügen, nachdem das System trainiert wurde?
Gibt es eine Standardmethode zum Zuordnen von Zeichenfolgen-, Wort- und Zeichendaten zu Eingaben in ein neuronales Netzwerk? Oder ist ein neuronales Netzwerk wirklich nicht das richtige Werkzeug zum Analysieren von Zeichenfolgendaten (was ist ein besseres Werkzeug für den Mustervergleich in Zeichenfolgendaten)?