MSE-Zerlegung in Varianz und Bias-Quadrat


23

Indem gezeigt wird, dass MSE in Varianz plus das Quadrat der Abweichung zerlegt werden kann, hat der Beweis in Wikipedia einen Schritt, der im Bild hervorgehoben ist. Wie funktioniert das? Wie wird die Erwartung vom 3. bis zum 4. Schritt in das Produkt umgesetzt? Wenn die beiden Begriffe unabhängig sind, sollte die Erwartung nicht auf beide Begriffe angewendet werden? und wenn nicht, ist dieser Schritt gültig?Bildbeschreibung hier eingeben

Antworten:


22

Der Trick ist , dass E(θ^)θ eine Konstante ist.


1
Oh ich verstehe. Das einzig Unbekannte ist hier der Schätzer. Recht?
statBeginner

2
Ja. Erwartung Mittel nehmen , dass der Schätzer geht, was auch immer es zu schätzen, das ist , was das macht gehen auf 0E(θ^E(θ^))
Adamo

5
Entschuldigung, dieser Satz ergibt für mich keinen Sinn. Wenn ein Schätzer zu dem gehen würde, was er schätzt, würde das ihn dann nicht unvoreingenommen machen? Kann es mit den Worten erklärt werden = E ( θ ) - E ( E ( θ ) ) = E ( θ ) - E ( θ ) = 0? E(θ^E(θ^))E(θ^)E(E(θ^))E(θ^)E(θ^)
user1158559

@ user1158559 Der Produktbegriff in der Mitte ist eine Konstante mal etwas mit dem erwarteten Wert 0. Auch wenn der Theta-Hut voreingenommen ist, ist es immer noch eine Konstante mal 0.
AdamO

3
ist eine Variable und keine Konstante. Auch ist der Trick weniger trivial und E ( c ) mit c eine Konstante ungleich 0 als Standard geworden ist (zum Beispiel E ( ( E ( θ ) - θ ) 2 ) 0 ). Der eigentliche Trick liegt in der Tatsache, dassx p ( x ) die Konstante ist (und aus einem Integral herausgenommen werden kann), also( x p ( xE(θ^)θE(c)cE((E(θ^)θ)2)0xp(x)(xp(x))p(x)=(xp(x))p(x)=(xp(x))1=(xp(x))
Sextus Empiricus

4

Adams Antwort ist richtig über den Trick , dass eine Konstante ist. Es hilft jedoch, das Endergebnis zu finden, und erklärt die Frage nach dem spezifischen Schritt im Wikipedia-Artikel nicht klar (Bearbeiten: Was ich jetzt sehe, war zweideutig, was das Highlight und den Schritt von Zeile drei zu Zeile vier betrifft ).E(θ^)θ

(beachten Sie die Frage über die Variable , die sich von konstanten E [ θ ] - θ in der Antwort von Adam ich das falsch in meinem Kommentar schrieb Erweiterung der Bedingungen für mehr Klarheit. der. Variable ist die geschätzte θ , Konstanten sind die Erwartung dieser Schätzung E [ θ ] und der wahre Wert θ )E[θ^]θ^ E[θ^]θθ^E[θ^]θ

Trick 1: Überlegen Sie

die Variable x=θ^

die Konstante ein=E[θ^]

und die Konstante b=θ

Dann kann die Beziehung geschrieben werden leicht die Transformationsregeln mit Hilfe der Momente der variablen exprimierenden etwa b in Bezug auf die Momente der Variablen x etwa ein .xbxein

E[(xb)n]=i=0n(ni)E[(xa)i](ab)ni

Trick 2: Im zweiten Moment enthält die obige Formel drei Terme in der Summe. Wir können einen von ihnen beseitigen (der Fall ) , da E [ ( θ - E [ θ ] ) ] = E [ θ ] - E [ E [ θ ] ] = 0i=1E[(θ^E[θ^])]=E[θ^]E[E[θ^]]=0

Hier kann man auch argumentieren, dass etwas eine Konstante ist. Nämlich , wenn a eine Konstante ist und mit einem = E ( θ ) , die eine Konstante ist, erhalten Sie E ( E ( θ ) ) = E ( θ ) .E(a)=aaa=E(θ)E(E(θ))=E(θ)

Intuitiver: Wir haben den Moment von ungefähr a gleich einem zentralen Moment gemacht (und die ungeraden zentralen Momente sind Null). Wir bekommen ein bisschen Tautologie. Durch Subtrahieren des Mittelwert aus den Variablen, θ - E [ θ ] , erzeugen wir eine Variable mit Mittelwert Null. Und der Mittelwert von 'einer Variablen mit dem Mittelwert Null' ist Null.xaθ^E[θ^]


Der Wikipedia-Artikel verwendet diese beiden Tricks in der dritten und vierten Zeile.

  • Die verschachtelte Erwartung in der dritten Zeile

    E[(θ^E(θ^))(E(θ^)θ)]

    wird , indem der konstante Teil vereinfacht außerhalb desselben (trick 1).(E(θ^)θ)

  • Der Ausdruck gelöst ist (als gleich Null) unter Ausnutzung der Tatsache , dass die Variable θ - E ( θ ) hat im Mittel null (trick 2).E(θ^E(θ^))θ^E(θ^)


3

ist keine Konstante.E(θ^)-θ

Der Kommentar von @ user1158559 ist eigentlich der richtige:

E[θ^E(θ^)]=E(θ^)E[E(θ^)]=E(θ^)E(θ^)=0

Ich verstehe nicht, was du zu zeigen versuchst. Auch die Vorspannung darf nicht Null sein, aber das bedeutet nicht, dass es keine Konstante ist.
Michael R. Chernick

Es ist keine Konstante , da θ = f ( D ) , wo D eine Trainingsdaten gegeben ist, die auch eine Zufallsvariable ist. Daher ist seine Erwartung keine Konstante. θ^=f(D)D
little_monster

Auch die Tatsache, dass es keine Konstante ist oder nicht, kann nicht erklären, wie Schritt 4 ab Schritt 3 möglich ist. Andererseits erklärt der Kommentar von @ user1158559 dies.
little_monster

@Michael, die Frage hat Verwirrung gestiftet. Der markierte Teil enthält diesen Ausdruck , aber in dem Text der Frage wird erwähnt, dass es , statt über die Änderung von der dritten Leitung zur vierten Leitung ist, die Änderung die Verschachtelung Erwartungen. E(θ^-E(θ^))=0
Sextus Empiricus
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.