Ich habe eine Data Mining-Aufgabe, bei der ich ein inhaltsbasiertes Bildabrufsystem erstelle. Ich habe 20 Bilder von 5 Tieren. Also insgesamt 100 Bilder.
Mein System gibt die 10 relevantesten Bilder an ein Eingabebild zurück. Jetzt muss ich die Leistung meines Systems mit einer Precision-Recall-Kurve bewerten. Ich verstehe jedoch das Konzept einer Precision-Recall-Kurve nicht. Angenommen, mein System gibt 10 Bilder für ein Gorilla-Bild zurück, aber nur 4 davon sind Gorillas. Die anderen 6 zurückgegebenen Bilder sind andere Tiere. Somit,
- Genauigkeit ist
4/10 = 0.4
(zurückgegebene Relevanten) / (alle zurückgegeben) - Rückruf ist
4/20 = 0.2
(zurückgegebene relevante) / (alle relevanten)
Ich habe also nur einen Punkt <0.2,0.4>
, keine Kurve. Wie habe ich eine Kurve (dh eine Reihe von Punkten)? Sollte ich die Anzahl der zurückgegebenen Bilder ändern (dies ist in meinem Fall auf 10 festgelegt)?