Warum definiert f Beta Score Beta so?


10

Dies ist der F-Beta-Score:

Fβ=(1+β2)precisionrecall(β2precision)+recall

Der Wikipedia-Artikel besagt, dass .Fβ "measures the effectiveness of retrieval with respect to a user who attaches β times as much importance to recall as precision"

Ich habe die Idee nicht bekommen. Warum so definieren ? Kann ich definieren :F ββFβ

Fβ=(1+β)precisionrecall(βprecision)+recall

Und wie soll man zeigen β times as much importance?


2
Schauen Sie sich unten eine neuere Antwort an, die die Differentialrechnung enthält, die sich mit "Warum Beta im Quadrat und nicht Beta" befasst.
Javadba

Antworten:


18

Wenn das Gewicht in der ersten von Ihnen angegebenen Definition und das Gewicht in der zweiten Definition ist, sind die beiden Definitionen äquivalent, wenn Sie festlegen , sodass diese beiden Definitionen nur Unterschiede in der Schreibweise darstellen die Definition des Scores. Ich habe gesehen, dass es sowohl den ersten Weg (z. B. auf der Wikipedia-Seite ) als auch den zweiten (z . B. hier ) definiert hat.˜ β ˜ β = β 2 F βββ~β~=β2Fβ

Das Maß wird erhalten, indem das harmonische Mittel der Präzision und des Rückrufs genommen wird, nämlich der Kehrwert des Durchschnitts des Kehrwerts der Präzision und des Kehrwerts des Rückrufs:F1

F1=1121precision+121recall=2precisionrecallprecision+recall

Anstatt Gewichte im Nenner zu verwenden, die gleich sind und sich zu 1 summieren ( für den Rückruf und für die Genauigkeit), können wir stattdessen Gewichte zuweisen, die sich immer noch zu 1 summieren, aber für Das Gewicht beim Rückruf ist mal so groß wie das Gewicht bei der Genauigkeit ( für den Rückruf und für die Genauigkeit). Dies ergibt Ihre zweite Definition des Scores: 112 ββ12β 1ββ+1 Fβ1β+1Fβ

Fβ=11β+11precision+ββ+11recall=(1+β)precisionrecallβprecision+recall

Wenn wir hier anstelle von , wären wir zu Ihrer ersten Definition gelangt, sodass die Unterschiede zwischen den beiden Definitionen nur eine Schreibweise sind. ββ2β


1
Warum multiplizierten sie mit dem Präzisionsbegriff anstelle des Rückrufbegriffs? β
Anwarvic

1
Die Differentialrechnung, die sich mit "Warum Beta im Quadrat und nicht Beta" befasst, ist in einer neueren Antwort unten enthalten.
Javadba

@Anwarvic Sie multiplizierten mit dem inversen Rückruf. Nach dem Ausklammern und dem Erweitern mit ist noch ein Begriff übrig( 1 + β ) Präzision erinnern an β Präzisionβ(1+β)precisionrecallβprecision
user2740

5

Der Grund für die Definition des F-Beta-Scores mit ist genau das von Ihnen angegebene Zitat (dh Sie möchten Zeiten so wichtig wie die Genauigkeit beim Abrufen anhängen ), wenn Sie eine bestimmte Definition für das Anhängen von angeben mal so wichtig wie Präzision.β2ββ

Die besondere Art und Weise, die relative Bedeutung der beiden Metriken zu definieren, die zur -Formulierung führt, findet sich in Information Retrieval (Van Rijsbergen, 1979):β2

Definition: Die relative Bedeutung, die ein Benutzer der Präzision und dem Abruf beimisst, ist das Verhältnis, bei dem , wobei ist das Maß für die Wirksamkeit basierend auf Präzision und Rückruf.P/RE/R=E/PE=E(P,R)

Die Motivation für dieses Wesen:

Der einfachste Weg, dies zu quantifizieren, besteht darin, das Verhältnis anzugeben, bei dem der Benutzer bereit ist, ein Präzisionsinkrement gegen einen gleichen Rückrufverlust einzutauschen.P/R

Um zu sehen, dass dies zur -Formulierung führt, können wir mit der allgemeinen Formel für das gewichtete harmonische Mittel von und und ihre partiellen Ableitungen in Bezug auf und berechnen . Die zitierte Quelle verwendet (für "Effektivitätsmaß"), das nur und die Erklärung ist äquivalent, ob wir oder .β2PRPRE1FEF

F=1(αP+1αR)

F/P=α(αP+1αR)2P2

F/R=1α(αP+1αR)2R2

Wenn Sie nun die Ableitungen gleich setzen, wird die Beziehung zwischen und dem Verhältnis . Angesichts der Tatsache, dass wir Zeiten so wichtig wie die Genauigkeit der Erinnerung beimessen möchten, werden wir das Verhältnis 1 berücksichtigen :αP/RβR/P

F/P=F/RαP2=1αR2RP=1αα

Wenn Sie als dieses Verhältnis definieren und für neu anordnen, erhalten Sie die Gewichtung in Bezug auf :βαβ2

β=1ααβ2=1ααβ2+1=1αα=1β2+1

1α=11β2+1β2β2+1

Wir erhalten:

F=1(1β2+11P+β2β2+11R)

Welches kann neu angeordnet werden, um das Formular in Ihrer Frage zu geben.

In Anbetracht der zitierten Definition sollte daher die Formulierung verwendet werden , wenn Sie Zeiten so viel Bedeutung beim Abrufen wie Präzision beimessen möchten . Diese Interpretation gilt nicht, wenn man . Die äquivalente, weniger intuitive Interpretation für den Fall, dass wir nur wäre, dass wir mal so viel Bedeutung beim Abrufen wie Präzision beimessen möchten .ββ2βββ

Sie können eine Punktzahl definieren, wie Sie vorschlagen. Sie sollten sich jedoch bewusst sein, dass in diesem Fall entweder die besprochene Interpretation nicht mehr gilt oder Sie eine andere Definition für die Quantifizierung des Kompromisses zwischen Präzision und Rückruf implizieren.

Fußnoten:

  1. P/R wird beim Abrufen von Informationen verwendet , dies scheint jedoch ein Tippfehler zu sein, siehe Die Wahrheit des F-Maßes (Saski, 2007).

Verweise:

  1. CJ Van Rijsbergen. 1979. Information Retrieval (2. Aufl.), S. 133-134
  2. Y. Sasaki. 2007. „Die Wahrheit des F-Maßes“, Lehre, Lernmaterialien

1
Dies sollte die akzeptierte Antwort sein.
Javadba

3

Um schnell auf etwas hinzuweisen.

Dies bedeutet, dass Sie mit zunehmendem Beta-Wert mehr Wert auf Präzision legen.

Ich denke tatsächlich, dass es das Gegenteil ist - da höher in der F-β-Wertung besser ist, möchten Sie, dass der Nenner klein ist. Wenn Sie daher β verringern, wird das Modell weniger für eine gute Genauigkeit bestraft. Wenn Sie β erhöhen, wird der F-β-Score bei hoher Präzision stärker bestraft.

Wenn Sie die F-β-Bewertung so gewichten möchten, dass sie die Genauigkeit bewertet, sollte β 0 <β <1 sein, wobei β-> 0 nur die Genauigkeit bewertet (der Zähler wird sehr klein, und das einzige, was im Nenner steht, ist das Abrufen). daher nimmt der F-β-Wert mit zunehmendem Rückruf ab).

http://scikit-learn.org/stable/modules/generated/sklearn.metrics.fbeta_score.html


0

Der Grund, warum β ^ 2 mit Präzision multipliziert wird, ist genau die Art und Weise, wie F-Scores definiert werden. Dies bedeutet, dass Sie mit zunehmendem Beta-Wert mehr Wert auf Präzision legen. Wenn Sie es mit einem Rückruf multiplizieren möchten, der auch funktionieren würde, würde dies nur bedeuten, dass Sie mit zunehmendem Beta-Wert mehr Wert auf Rückruf legen.


0

Der Beta-Wert größer als 1 bedeutet, dass unser Modell dem Modellrückruf im Vergleich zu Precision mehr Aufmerksamkeit schenken soll. Andererseits legt ein Wert von weniger als 1 mehr Wert auf Präzision.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.