Der Schätzer für den Korrelationskoeffizienten (der im Fall einer bivariaten Standardnormalen gleich der Kovarianz ist)
r~=1n∑i=1nxiyi
ist der Method-of-Moments-Schätzer, die Stichproben-Kovarianz. Mal sehen, ob es mit dem Maximum-Likelihood-Schätzer übereinstimmt .ρ^
Die Gelenkdichte einer bivariaten Standardnormalen mit dem Korrelationskoeffizienten beträgtρ
f(x,y)=12π1−ρ2−−−−−√exp{−x2+y2−2ρxy2(1−ρ2)}
und so die log-Wahrscheinlichkeit einer iid Stichprobe der Größe ist ,n
lnL=−nln(2π)−n2ln(1−ρ2)−12(1−ρ2)∑i=1n(x2i+y2i−2ρxiyi)
(hier bezieht sich die iid-Annahme natürlich auf jede Ziehung aus der zweidimensionalen Population)
Wenn man die Ableitung in Bezug auf und sie auf Null setzt, erhält man ein 3D-Polynom in :ρρ
ρ^:nρ^3−(∑i=1nxiyi)ρ^2−(1−1n∑i=1n(x2i+y2i))nρ^−∑i=1nxiyi=0
Dass die Berechnungen korrekt sind, kann überprüft werden, wenn man den erwarteten Wert der Ableitung nimmt, die mit dem wahren Koeffizienten -it gleich Null bewertet wird.ρ
Für die Kompaktheit schreiben Sie , was die Summe der Stichprobenvarianzen von und . Wenn wir den Ausdruck der 1. Ableitung durch teilen, erscheint spezifisch der MoM-Schätzer(1/n)∑ni=1(x2i+y2i)=(1/n)S2XYn
ρ^:ρ^3−r~ρ^2+[(1/n)S2−1]ρ^−r~=0
⇒ρ^(ρ^2−r~ρ^+[(1/n)S2−1])=r~
Bei der Algebra ist es nicht schwer zu schließen, dass wir genau dann wenn und nur wenn , dh nur dann, wenn die Summe der Stichprobenvarianzen gleich ist die Summe der wahren Abweichungen. Also im Allgemeinenρ^=r~(1/n)S2=2
ρ^≠r~
Was passiert hier? Jemand, der klüger ist, wird es erklären. Lassen Sie uns zunächst eine Simulation versuchen: Ich habe eine iid-Stichprobe von zwei Standardnormalen mit dem Korrelationskoeffizienten generiert . Die Stichprobengröße betrug . Die Probenwerte warenρ=0.6n=1.000
∑i=1nxiyi=522.05,S2=1913.28
Der Momentenschätzer gibt uns
r~=522.051000=0.522
Was passiert mit der Log-Wahrscheinlichkeit? Optisch haben wir
Numerisch haben wir
ρ0.50.510.520.530.540.550.560.570.580.590.61st deriv−70.92−59.41−47.7−35.78−23.64−11.291.2914.127.1540.4453.98lnL−783.65−782.47−781.48−780.68−780.1−779.75−779.64−779.81−780.27−781.05−782.18
und wir sehen, dass die log-Wahrscheinlichkeit ein Maximum ein bisschen vor wobei auch die 1. Ableitung Null wird . Keine Überraschungen für die Werte von nicht gezeigt. Auch die 1. Ableitung hat keine andere Wurzel.ρ=0.56(ρ^=0.558985)ρ
Diese Simulation stimmt also mit dem Ergebnis überein, dass der Maximum-Likelihood-Schätzer nicht der Methode des Momentenschätzers entspricht (bei der es sich um die Stichproben-Kovarianz zwischen den beiden RVs handelt).
Aber es scheint, dass "jeder" sagt, dass es ... also sollte jemand eine Erklärung finden.
AKTUALISIEREN
Eine Referenz, die beweist, dass der MLE der Schätzer für die Methode der Momente ist: Anderson, TW & Olkin, I. (1985). Maximum-Likelihood-Schätzung der Parameter einer multivariaten Normalverteilung. Lineare Algebra und ihre Anwendungen, 70, 147-171.
Ist es wichtig, dass hier alle Mittel und Abweichungen frei variieren und nicht festgelegt werden können?
... Wahrscheinlich ja, weil der Kommentar von @ guy in einer anderen (jetzt gelöschten) Antwort besagt, dass mit gegebenen Mittelwert- und Varianzparametern die bivariate Normalität ein Mitglied der gekrümmten Exponentialfamilie wird (und sich daher einige Ergebnisse und Eigenschaften ändern) ... Dies scheint der einzige Weg zu sein, um die beiden Ergebnisse in Einklang zu bringen.