Gegeben
- ein Datensatz mit Instanzen zusammen mit N Klassen, wobei jede Instanz x i genau zu einer Klasse y i gehört
- ein Klassifikator für mehrere Klassen
Nach dem Training und Testen habe ich grundsätzlich eine Tabelle mit der wahren Klasse und der vorhergesagten Klasse a i für jede Instanz x i im Testsatz. Also habe ich für jede Instanz entweder eine Übereinstimmung ( y i = a i ) oder eine Verfehlung ( y i ≠ a i ).
Wie kann ich die Qualität des Spiels bewerten? Das Problem ist, dass einige Klassen viele Mitglieder haben können, dh viele Instanzen gehören dazu. Wenn 50% aller Datenpunkte zu einer Klasse gehören und mein Endklassifikator zu 50% korrekt ist, habe ich offensichtlich nichts gewonnen. Ich hätte genauso gut einen trivialen Klassifikator erstellen können, der die größte Klasse ausgibt, unabhängig von der Eingabe.
Gibt es eine Standardmethode, um die Qualität eines Klassifikators basierend auf den bekannten Testergebnissen von Übereinstimmungen und Treffern für jede Klasse zu schätzen? Vielleicht ist es sogar wichtig, Übereinstimmungsraten für jede bestimmte Klasse zu unterscheiden?
Der einfachste Ansatz, den ich mir vorstellen kann, ist es, die richtigen Matches der größten Klasse auszuschließen. Was sonst?