Erstens finde ich "Genauigkeit" manchmal etwas irreführend, da sie sich auf bestimmte Dinge bezieht:
Der Begriff Genauigkeit im Geneal für die Bewertung von Systemen oder Methoden (ich bin analytischer Chemiker) bezieht sich auf die Verzerrung von Vorhersagen, dh er beantwortet die Frage, wie gut Vorhersagen im Durchschnitt sind.
Wie Sie wissen, gibt es viele verschiedene Leistungsmaßstäbe, die unterschiedliche Leistungsaspekte für Klassifizierer beantworten. Eine davon nennt man auch Genauigkeit. Wenn Ihre Arbeit nicht für ein Publikum mit maschinellem Lernen / Klassifizierung gedacht ist, empfehle ich, diese Unterscheidung sehr deutlich zu machen. Selbst für diese spezifischere Bedeutung von Genauigkeit würde ich sehr genau sagen, was ich Genauigkeit nenne, da wiederum verschiedene Arten des Umgangs mit Klassenungleichgewichten auftreten können. Typischerweise wird das Klassenungleichgewicht ignoriert, was zu dem bekannten Berechnung. Sie können jedoch auch den Durchschnitt der Sensitivität und Spezifität verwenden, der der Kontrolle des Klassenungleichgewichts durch Gewichtung Ihres Durchschnitts gleichkommt.T.P.+ T.N.a l l c a s e s
Der F-Score wird häufig als harmonisches Mittel für Präzision und Erinnerung (oder als positiver Vorhersagewert und Empfindlichkeit) eingeführt. Für Ihre Frage halte ich es für hilfreich, dies etwas näher zu formulieren und zu vereinfachen:
F.= 2 ⋅ p r e c i s i o n ⋅ r e c a l lp r e c i s i o n + r e c a l l= 2 T.P.a l l P. T.P.a l l T.T.P.a l l P. + T.P.a l l T.= 2 T.P.2a l l P. ⋅ a l l T.T.P.⋅ a l l T. a l l P. ⋅ a l l T.+ T.P.⋅ a l l P. a l l P. ⋅ a l l T.= 2 T. P.2T.P.⋅ a l l T. + T.P.⋅ a l l P. = 2 T. P.a l l T. + a l l P.
Der letzte Ausdruck ist kein Bruchteil von allem, was ich mir als eine bestimmte Gruppe von Testfällen vorstellen kann. Insbesondere wird eine (starke) Überlappung zwischen den Fällen TRUE und POSITIVE erwartet. Dies würde mich davon abhalten, einen F-Score als Prozentsatz auszudrücken, da dies einen Teil der Fälle impliziert. Eigentlich denke ich, ich würde den Leser warnen, dass der F-Score keine solche Interpretation hat.