Ich habe eine Klassifizierung unter Verwendung mehrerer Klassifizierer für Daten mit 2 Klassen durchgeführt und eine 5-fache Kreuzvalidierung verwendet. Für jede Falte berechnete ich tp, tn, fp und fn. Dann berechnete ich die Genauigkeit, Präzision, Rückruf und F-Punktzahl für jeden Test. Meine Frage ist, wenn ich die Ergebnisse mitteln möchte, habe ich den Durchschnitt der Genauigkeiten genommen, aber kann ich auch die Präzision, den Rückruf und den F-Score mitteln? Oder wäre das mathematisch falsch? PS Die in jeder Falte verwendeten Datensätze sind in Bezug auf die Anzahl der Instanzen pro Klasse gut ausgewogen.
Vielen Dank.