Beispiele: Ich habe einen Satz in der Stellenbeschreibung: "Java Senior Engineer in UK".
Ich möchte ein Deep-Learning-Modell verwenden, um es als zwei Kategorien vorherzusagen: English
und IT jobs
. Wenn ich ein traditionelles Klassifizierungsmodell verwende, kann es nur 1 Etikett mit softmax
Funktion auf der letzten Ebene vorhersagen . Somit kann ich 2 Modell-Neuronale Netze verwenden, um "Ja" / "Nein" für beide Kategorien vorherzusagen, aber wenn wir mehr Kategorien haben, ist es zu teuer. Haben wir also ein Deeplearning- oder maschinelles Lernmodell, um zwei oder mehr Kategorien gleichzeitig vorherzusagen?
"Bearbeiten": Bei 3 Beschriftungen nach herkömmlichem Ansatz wird es mit [1,0,0] codiert, in meinem Fall jedoch mit [1,1,0] oder [1,1,1].
Beispiel: Wenn wir 3 Beschriftungen haben und ein Satz mit all diesen Beschriftungen übereinstimmen kann. Wenn also die Ausgabe der Softmax-Funktion [0,45, 0,35, 0,2] ist, sollten wir sie in 3 oder 2 Labels klassifizieren, oder kann es eines sein? Das Hauptproblem dabei ist: Was ist ein guter Schwellenwert für die Klassifizierung in 1, 2 oder 3 Labels?