Mittelung der Präzision und des Rückrufs bei Verwendung der Kreuzvalidierung


11

Ich habe eine Klassifizierung unter Verwendung mehrerer Klassifizierer für Daten mit 2 Klassen durchgeführt und eine 5-fache Kreuzvalidierung verwendet. Für jede Falte berechnete ich tp, tn, fp und fn. Dann berechnete ich die Genauigkeit, Präzision, Rückruf und F-Punktzahl für jeden Test. Meine Frage ist, wenn ich die Ergebnisse mitteln möchte, habe ich den Durchschnitt der Genauigkeiten genommen, aber kann ich auch die Präzision, den Rückruf und den F-Score mitteln? Oder wäre das mathematisch falsch? PS Die in jeder Falte verwendeten Datensätze sind in Bezug auf die Anzahl der Instanzen pro Klasse gut ausgewogen.

Vielen Dank.


3
Ich bin auf dasselbe Problem bei der Berechnung des F-Maßes (harmonisches Mittel der Präzision und des Rückrufs) mithilfe der Kreuzvalidierung gestoßen. In diesem Artikel haben sie tatsächlich gezeigt, dass die Berechnung des F-Maßes für den gesamten Satz und nicht die Mittelung die weniger voreingenommene Methode ist. Ich hoffe, das kann helfen
Papafe

3
@markusian Bitte füge dies als Antwort hinzu! Es ist bei weitem das Wichtigste auf dieser Seite !!
Drevicko

Antworten:


2

F.

F.1=2PräzisionerinnernPräzision+erinnern
F.ββ
F.β=(1+β2)Präzisionerinnern(β2Präzision)+erinnern
F.

tF.F.


Ja, ich habe die erste Formel verwendet. Dies bedeutet, dass die Mittelung des F-Scores aus den verschiedenen Tests ähnliche Ergebnisse liefert wie die Mittelung der Genauigkeit und des Abrufs und die anschließende Berechnung des F-Scores aus diesen. Ich habe es mit den Ergebnissen versucht, die ich habe, und es war fast das gleiche. Vielen Dank.
Kalaji
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.