Ich höre oft von der Bewertung der Leistung eines Klassifizierungsmodells, indem ich den Testsatz aushalte und ein Modell auf dem Trainingssatz trainiere. Erstellen Sie dann zwei Vektoren, einen für die vorhergesagten Werte und einen für die wahren Werte. Ein Vergleich ermöglicht es offensichtlich, die Leistung des Modells anhand seiner Vorhersagekraft anhand von Dingen wie F-Score, Kappa-Statistik, Precision & Recall, ROC-Kurven usw. zu beurteilen.
Wie ist dies im Vergleich zur Bewertung numerischer Vorhersagen wie Regression? Ich würde annehmen, dass Sie das Regressionsmodell auf dem Trainingssatz trainieren, es zur Vorhersage von Werten verwenden und diese vorhergesagten Werte dann mit den wahren Werten im Testsatz vergleichen könnten. Offensichtlich müssten die Leistungsmaße unterschiedlich sein, da dies keine Klassifizierungsaufgabe ist. Die üblichen Residuen und -Statistiken sind offensichtliche Messgrößen. Gibt es jedoch mehr / bessere Möglichkeiten, die Leistung für Regressionsmodelle zu bewerten? Es scheint, dass die Klassifizierung so viele Optionen hat, aber die Regression bleibt R 2 und Residuen überlassen .