Angenommen, ich erstelle einen logistischen Regressionsklassifikator, der vorhersagt, ob jemand verheiratet oder ledig ist. (1 = verheiratet, 0 = ledig) Ich möchte einen Punkt auf der Präzisionsrückrufkurve auswählen, der mir eine Genauigkeit von mindestens 75% gibt. möchte ich die Schwellenwerte und auswählen , damit:
- Wenn die Ausgabe meines Klassifikators größer als , ich "verheiratet" aus.
- Wenn der Ausgang unter , ich "single" aus.
- Wenn die Ausgabe dazwischen liegt, gebe ich "Ich weiß nicht" aus.
Ein paar Fragen:
- Ich denke, unter der Standarddefinition von Präzision wird Präzision nur die Präzision der verheirateten Klasse messen (dh Präzision = # Mal, wenn ich die Ehe richtig vorhersage / Gesamt # Mal, wenn ich die Ehe vorhersage). Was ich jedoch wirklich tun möchte, ist die Gesamtgenauigkeit zu messen (dh die Gesamtanzahl der Zeiten, in denen ich verheiratet oder ledig voraussage, / die Gesamtanzahl, in der ich verheiratet oder ledig vorhersage). Ist das in Ordnung? Wenn nicht, was soll ich tun?
- Gibt es eine Möglichkeit, diese "Gesamt" -Präzisions- / Rückrufkurve in R zu berechnen (z. B. mithilfe des ROCR-Pakets oder einer anderen Bibliothek)? Ich verwende derzeit das ROCR-Paket, aber es scheint mir nur die Präzision / den Rückruf einer einzelnen Klasse zu geben.