Warum wird das F-Maß normalerweise für (überwachte) Klassifizierungsaufgaben verwendet, während das G-Maß (oder der Fowlkes-Mallows-Index) im Allgemeinen für (unbeaufsichtigte) Clustering-Aufgaben verwendet wird?
Das F-Maß ist das harmonische Mittel der Präzision und des Rückrufs .
Das G-Maß (oder der Fowlkes-Mallows-Index) ist das geometrische Mittel der Präzision und des Rückrufs .
Unten sehen Sie eine Darstellung der verschiedenen Mittel.
F1 (harmonisch)
Geometric
Arithmetik
Der Grund, den ich frage, ist, dass ich entscheiden muss, welcher Durchschnitt in einer NLG-Aufgabe verwendet werden soll, in der ich BLEU und ROUGE gemessen habe (wobei BLEU Präzision und ROUGE entspricht, an die erinnert werden soll). Wie soll ich den Mittelwert dieser Werte berechnen?