Meiner Meinung nach ist dies subjektiv und problemspezifisch. Sie sollten den wichtigsten Faktor in Ihrem Kopf als Fahrmetrik verwenden, da dies Ihre Entscheidungen darüber, wie Sie das Modell ändern möchten, besser fokussieren kann.
Die meisten Metriken, die berechnet werden können, sind in vielerlei Hinsicht korreliert / ähnlich: Wenn Sie beispielsweise MSE für Ihren Verlust verwenden und dann MAPE (mittlerer durchschnittlicher prozentualer Fehler) oder einfachen Verlust aufzeichnen , erhalten Sie vergleichbare Verlustkurven.L1
Wenn Sie beispielsweise einen F1-Score in Ihrem Bericht / an Ihren Chef usw. melden (und davon ausgehen, dass dies das ist, was ihn wirklich interessiert), kann die Verwendung dieser Metrik am sinnvollsten sein. Der F1-Score berücksichtigt beispielsweise Präzision und Rückruf , dh er beschreibt die Beziehung zwischen zwei feinkörnigeren Metriken.
Wenn Sie diese Dinge zusammenführen, kann es hilfreich sein, andere Ergebnisse als den normalen Verlust zu berechnen, um einen Überblick zu erhalten und zu sehen, wie Ihre endgültige Metrik im Verlauf der Trainingsiterationen optimiert wird. Diese Beziehung könnte Ihnen vielleicht einen tieferen Einblick in das Problem geben,
In der Regel ist es jedoch am besten, mehrere Optionen auszuprobieren, da durch die Optimierung des Validierungsverlusts das Training möglicherweise länger dauern kann, was letztendlich auch zu einem überlegenen F1-Score führen kann . Präzision und Rückruf können sich um einige lokale Minima bewegen und einen fast statischen F1-Score erzeugen - Sie würden also mit dem Training aufhören. Wenn Sie für den reinen Verlust optimiert haben, haben Sie möglicherweise genügend Verlustschwankungen registriert, um länger trainieren zu können.
cross_entropy
Verlust ein bevorzugterer Kandidat alsMSE
oderMAE
. Lesen Sie den Abschnitt "Zusammenfassung" dieses Artikels und diesen Beitrag zu Statistiken .