Ich habe ein neuronales Netzwerk eingerichtet, um etwas vorherzusagen, bei dem die Ausgabevariable ordinal ist. Ich werde im Folgenden drei mögliche Ausgänge A <B <C beschreiben.
Es ist ziemlich offensichtlich, wie ein neuronales Netzwerk zur Ausgabe kategorialer Daten verwendet wird: Die Ausgabe ist nur ein Softmax der letzten (normalerweise vollständig verbundenen) Schicht, eine pro Kategorie, und die vorhergesagte Kategorie ist die mit dem größten Ausgabewert (dies ist die Standardeinstellung in vielen gängigen Modellen). Ich habe das gleiche Setup für Ordnungswerte verwendet. In diesem Fall sind die Ausgaben jedoch oftmals nicht sinnvoll. Beispielsweise sind die Netzwerkausgaben für A und C hoch, aber B ist niedrig: Dies ist für Ordnungswerte nicht plausibel.
Ich habe eine Idee dafür, nämlich den Verlust zu berechnen, indem die Ausgaben mit 1 0 0 für A, 1 1 0 für B und 1 1 1 für C verglichen werden. Die genauen Schwellenwerte können später mit einem anderen Klassifikator (z. B. Bayesian) eingestellt werden ), aber dies scheint die Grundidee einer Reihenfolge der Eingaben zu erfassen, ohne eine bestimmte Intervallskala vorzuschreiben.
Was ist die Standardmethode zur Lösung dieses Problems? Gibt es Forschungsergebnisse oder Referenzen, die die Vor- und Nachteile verschiedener Ansätze beschreiben?