Der Nenner des (unverzerrten) Varianzschätzers ist da Beobachtungen vorliegen und nur ein Parameter geschätzt wird.
Aus dem gleichen Grund frage ich mich, warum der Nenner der Kovarianz nicht wenn zwei Parameter geschätzt werden.
Der Nenner des (unverzerrten) Varianzschätzers ist da Beobachtungen vorliegen und nur ein Parameter geschätzt wird.
Aus dem gleichen Grund frage ich mich, warum der Nenner der Kovarianz nicht wenn zwei Parameter geschätzt werden.
Antworten:
Ein spezieller Fall sollte Ihnen eine Intuition geben; Denken Sie an Folgendes:
Sie sind froh, dass letztere ist Bessel-Korrektur.
Aber wenn Sie durch in für das erstere ersetzen, erhalten Sie , was könnte Ihrer Meinung nach am besten ausfüllen?
Eine schnelle und schmutzige Antwort ... Betrachten wir zuerst ; Wenn Sie Beobachtungen mit bekanntem Erwartungswert , würden Sie , um die Varianz zu schätzen.
Da der erwartete Wert unbekannt ist, können Sie Ihre Beobachtungen in Beobachtungen mit bekanntem erwarteten Wert umwandeln, indem Sie für . Sie erhalten eine Formel mit einem im Nenner - die sind jedoch nicht unabhängig und müssen dies berücksichtigen; Am Ende findest du die übliche Formel.
Jetzt für die Kovarianz können Sie die gleiche Idee verwenden: Wenn der Erwartungswert von ist , würden Sie haben einen in der Formel. Wenn Sie von allen anderen beobachteten Werten subtrahieren , erhalten Sie Beobachtungen mit bekanntem Erwartungswert ... und einem in der Formel Konto.
PS Die saubere Art und Weise zu tun , ist eine orthonormale Basis wählen , das heißt Vektoren so dass
Sie können dann Variablen definieren: und . Die sind unabhängig, haben einen erwarteten Wert und haben die gleiche Varianz / Kovarianz wie die ursprünglichen Variablen.
Der springende Punkt ist, dass, wenn Sie die unbekannte Erwartung loswerden möchten, Sie eine (und nur eine) Beobachtung fallen lassen. Dies funktioniert in beiden Fällen gleich.
Hier ist ein Beweis, dass der p-variable Stichproben-Kovarianzschätzer mit dem Nenner ein unverzerrter Schätzer der Kovarianzmatrix ist:
.
So zeigen Sie:
Beweis:
Nächster:
(1)
(2)
Deshalb:
Und so ist mit dem letzten Nenner unvoreingenommen. Die nicht diagonalen Elemente von sind Ihre individuellen Beispielkovarianzen.
Zusätzliche Bemerkungen:
Die n Ziehungen sind unabhängig. Dies wird in (2) verwendet, um die Kovarianz des Stichprobenmittelwerts zu berechnen.
Schritt (1) und (2) verwenden die Tatsache, dass
Schritt (2) verwendet die Tatsache, dass
Ich vermute, eine Möglichkeit, die Intuition hinter der Verwendung von 'n-1' und nicht 'n-2' aufzubauen, besteht darin, dass wir für die Berechnung der Kovarianz nicht beide Bedeutungen von X und Y aufheben müssen, sondern eine der beiden
1) Starten Sie .
2) Die ist proportional zu . Verliere zwei ; eine aus , eine aus was zu .
3) enthält jedoch nur separate Begriffe, einen von jedem Produkt. Wenn zwei Zahlen miteinander multipliziert werden, verschwinden die unabhängigen Informationen von jeder einzelnen Zahl.
Betrachten Sie das als ein banales Beispiel
,
und das schließt Irrationalen und Brüche nicht ein, zB , so dass wir, wenn wir zwei Zahlenreihen miteinander multiplizieren und ihr Produkt untersuchen, nur aus einer Zahlenreihe, da wir die Hälfte der ursprünglichen Informationen verloren haben, d. h. was diese beiden Zahlen waren, bevor die paarweise Gruppierung in eine Zahl (dh Multiplikation) durchgeführt wurde.
Mit anderen Worten, ohne Verlust der Allgemeinheit können wir schreiben
für einige und ,
dh und, . Aus den , die dann eindeutig , wird die Kovarianzformel
.
Die Antwort auf die Frage lautet also, dass die durch Gruppierung halbiert werden.
Hold
?