Antworten:
Viele Klassifikatoren können kontinuierliche Ergebnisse vorhersagen. Kontinuierliche Bewertungen sind häufig Zwischenergebnisse, die nur als allerletzter Schritt der Klassifizierung in Klassenbezeichnungen (normalerweise nach Schwellenwert) konvertiert werden. In anderen Fällen können zB hintere Wahrscheinlichkeiten für die Klassenzugehörigkeit berechnet werden (zB Diskriminanzanalyse, logistische Regression). Sie können die MSE anhand dieser fortlaufenden Bewertungen und nicht anhand der Klassenbezeichnungen berechnen. Dies hat den Vorteil, dass Sie den Informationsverlust durch die Dichotomisierung vermeiden.
Wenn die kontinuierliche Bewertung eine Wahrscheinlichkeit ist, wird die MSE-Metrik als Brier-Bewertung bezeichnet.
Es gibt jedoch auch Klassifizierungsprobleme, bei denen es sich eher um Regressionsprobleme handelt. In meinem Bereich könnte dies beispielsweise die Klassifizierung von Fällen danach sein, ob die Konzentration eines Stoffes eine gesetzliche Grenze überschreitet oder nicht (was ein binäres / diskriminierendes Zwei-Klassen-Problem ist). Hier ist MSE aufgrund der zugrunde liegenden Regressionscharakteristik der Aufgabe eine natürliche Wahl.
In diesem Artikel erklären wir es als Teil eines allgemeineren Rahmens:
C. Beleites, R. Salzer und V. Sergo:
Validierung von Modellen zur weichen Klassifizierung unter Verwendung von Teilklassenmitgliedschaften: Ein erweitertes Konzept von Sensitivity & Co., das auf die Einstufung von Astrozytomgeweben angewendet wird
Chemom. Intell. Labor. Syst., 122 (2013), 12-22.
So berechnen Sie es: Wenn Sie in R arbeiten, befindet sich eine Implementierung im Paket "softclassval", http: /softclassval.r-forge.r-project.org.
Ich verstehe nicht ganz, wie ... eine erfolgreiche Klassifizierung eine binäre Variable ist (richtig oder nicht), daher ist es schwierig zu erkennen, was Sie quadrieren würden.
Im Allgemeinen werden Klassifizierungen anhand von Indikatoren wie dem korrekten Prozentsatz gemessen, wenn eine Klassifizierung, die aus einem Trainingssatz geschätzt wurde, auf einen Testsatz angewendet wird, der zuvor beiseite gelegt wurde.
Der mittlere quadratische Fehler kann (und wird) sicherlich für Vorhersagen oder vorhergesagte Werte kontinuierlicher Variablen berechnet werden, aber ich denke nicht für Klassifikationen.
Technisch können Sie, aber die MSE-Funktion ist für die binäre Klassifizierung nicht konvex. Wenn also ein binäres Klassifizierungsmodell mit der MSE-Kostenfunktion trainiert wird, kann nicht garantiert werden, dass die Kostenfunktion minimiert wird . Die Verwendung von MSE als Kostenfunktion setzt auch die Gaußsche Verteilung voraus, was bei der binären Klassifizierung nicht der Fall ist.