Ich baue ein neuronales Netz auf, um den Wert eines Kunstwerks mit einer Vielzahl von Eingaben (Größe, Kunstmedium usw.) vorherzusagen, und ich möchte den Autor auch als Eingabe einbeziehen (es ist oft sehr groß den Wert eines einzelnen Kunstwerks berücksichtigen).
Meine derzeitige Sorge ist, dass der Name des Autors keine ideale numerische Eingabe für eine NN ist (dh wenn ich nur jeden Autor mit einem zunehmenden ganzzahligen Wert codiere, werde ich den Autoren weiter unten in der Liste indirekt mehr Wert zuweisen -_-) . Meine Gedanken waren, separate Eingaben für alle Autoren in meinem Datensatz zu erstellen und dann nur eine Hot-Codierung zu verwenden, um die Eingabe in das NN besser darzustellen.
Dieser Ansatz stößt jedoch auf ein Problem, wenn ein Autor, der nicht in meinen Trainingsdaten enthalten ist, als Eingabe für die NN verwendet wird (dh ein neuer Autor). Ich kann dies mit einem Eingabefeld "anderer Autor" umgehen, aber ich mache mir Sorgen, dass dies nicht korrekt ist, da ich die NN für diese Eingabe nicht trainiert hätte (alle Kunstwerke mit einer Bewertung haben einen Autor).
Ich habe das noch nicht vollständig durchdacht, aber ich dachte daran, vielleicht 2 NNs zu trainieren, eine für eine Bewertung ohne Autor und eine für die Bewertung mit einem Autor, um sicherzustellen, dass ich über genügend Trainingsdaten für eine "autorlose Bewertung" verfüge, um immer noch einigermaßen genau zu sein.
Ich versuche immer noch, die beste NN-Architektur zu konzipieren, bevor ich mich auf die Implementierung einlasse. Wenn also jemand Vorschläge / Kommentare hat, wäre ich sehr dankbar!
Vielen Dank im Voraus, Vince
PS Ich mache dies als kleinen Wettbewerb mit einem Freund, um einen NN gegen die traditionellen kommerziellen Bewertungstechniken zu testen. Bitte helfen Sie mir, einen Sieg für Informatik über Versicherungsmathematik zu erzielen.