Ich habe ein trainiertes logistisches Regressionsmodell, das ich auf einen Testdatensatz anwende. Die abhängige Variable ist binär (boolesch). Für jede Stichprobe im Testdatensatz wende ich das logistische Regressionsmodell an, um eine prozentuale Wahrscheinlichkeit zu generieren, dass die abhängige Variable wahr ist. Dann zeichne ich auf, ob der aktuelle Wert wahr oder falsch war. Ich versuche, eine oder angepasste Zahl wie in einem linearen Regressionsmodell zu berechnen .
Dies gibt mir eine Aufzeichnung für jede Probe im Testsatz wie:
prob_value_is_true acutal_value
.34 0
.45 1
.11 0
.84 0
.... ....
Ich frage mich, wie man die Genauigkeit des Modells prüft. Mein erster Versuch war, eine Kontingenztabelle zu verwenden und "wenn prob_value_is_true
> 0,80, denke, dass der tatsächliche Wert wahr ist" und dann das Verhältnis von korrekten zu falschen Klassifizierungen zu messen. Aber das gefällt mir nicht, weil es sich eher so anfühlt, als würde ich nur die 0,80 als Grenze bewerten, nicht die Genauigkeit des Modells als Ganzes und überhaupt prob_value_is_true
Werte.
Dann habe ich versucht, jeden prob_value_is_true diskreten Wert als Beispiel zu betrachten, indem ich alle Samples mit prob_value_is_true
= 0,34 betrachtete und den Prozentsatz der Samples maß, bei denen der aktuelle Wert wahr ist (in diesem Fall wäre die perfekte Genauigkeit der Prozentsatz der Samples das war wahr = 34%). Ich könnte eine Modellgenauigkeitsbewertung erstellen, indem ich die Differenz bei jedem diskreten Wert von summiere prob_value_is_true
. Die Stichprobengrößen sind hier jedoch ein großes Problem, insbesondere bei den Extremen (nahe 0% oder 100%), so dass die Durchschnittswerte der akuten Werte nicht genau sind. Daher scheint es nicht richtig, sie zur Messung der Modellgenauigkeit zu verwenden.
Ich habe sogar versucht, große Bereiche zu erstellen, um ausreichende Stichprobengrößen (0 - 25, 25 - 50, 50 - 75, 75 - 1,0) sicherzustellen, aber wie man die "Güte" dieses Prozentsatzes des tatsächlichen Werts misst, ist mir ein Rätsel . Angenommen, alle Proben mit prob_value_is_true
Werten zwischen 0,25 und 0,50 haben einen Durchschnitt acutal_value
von 0,45. Ist das gut, da es im Sortiment ist? Schlecht, da es nicht in der Nähe von 37,5% (der Mitte des Bereichs) ist?
Ich bleibe also bei der Frage, wie es scheint, und hoffe, dass jemand mich auf eine Ressource oder Methode hinweisen kann, um eine Genauigkeitsstastik für ein logistisches Regressionsmodell zu berechnen.