Was ist die beste Kostenfunktion, um ein neuronales Netzwerk für die Durchführung einer ordinalen Regression zu trainieren , dh um ein Ergebnis vorherzusagen, dessen Wert auf einer beliebigen Skala existiert, bei der nur die relative Reihenfolge zwischen verschiedenen Werten von Bedeutung ist (z. B. um vorherzusagen, welche Produktgröße ein Kunde bestellen wird : 'klein' (codiert als 0), 'mittel' (codiert als 1), 'groß' (codiert als 2) oder 'extragroß' (codiert als 3))? Ich versuche herauszufinden, ob es bessere Alternativen gibt als quadratischen Verlust (Modellierung des Problems als Vanille-Regression) oder Kreuzentropieverlust (Modellierung des Problems als Klassifizierung).