Erwarteter Wert der Maximum-Likelihood-Münzparameterschätzung


8

Angenommen, ich habe ein Münzwurf-Experiment, bei dem ich die maximale Wahrscheinlichkeitsschätzung des Münzparameters berechnen möchte, wenn ich die Münze mal werfe . Nach der Berechnung der Ableitung der Binomialwahrscheinlichkeitsfunktion L (p) = {n \ wähle x} p ^ x (1-p) ^ {nx} erhalte ich den optimalen Wert für p als p ^ {*} = \ frac {x} {n} , wobei x die Anzahl der Erfolge ist.npnL(p)=(nx)px(1p)nxp = xp xp=xnx

Meine Fragen sind jetzt:

  • Wie würde ich den erwarteten Wert / die erwartete Varianz dieser Maximum-Likelihood-Schätzung für p berechnen p?
  • Muss ich den erwarteten Wert / die erwartete Varianz für L (p ^ {*}) berechnen L(p)?
  • Wenn ja, wie würde ich das machen?

1
Ich vermute, dies ist eine Art Selbststudium (Sie sollten es als solches kennzeichnen). Was genau willst du? Rückschluss auf Ihren Parameter?
pkofod

Was meinst du mit Rückschluss auf den Parameter? Ich bin mir nicht sicher, wie ich den erwarteten Wert / die erwartete Varianz für die Menge p ^ {*} berechnen würde p. Ich meine, ich weiß, was Mittelwert / Varianz ist und wie man es für einfache Beispiele berechnet, aber ich verstehe nicht, wie man es auf p ^ {*} anwendet p.
Manu

Antworten:


6

Zuallererst ist dies eine Frage zum Selbststudium, daher werde ich zu sehr auf jedes kleine technische Detail eingehen, aber ich werde auch keinen Ableitungsrausch erleben. Es gibt viele Möglichkeiten, dies zu tun. Ich werde Ihnen helfen, indem ich allgemeine Eigenschaften des Maximum-Likelihood-Schätzers verwende.

Hintergrundinformation

Um Ihr Problem zu lösen, müssen Sie meiner Meinung nach von Anfang an die maximale Wahrscheinlichkeit untersuchen. Sie verwenden wahrscheinlich eine Art Lehrbuch, und die Antwort sollte wirklich irgendwo da sein. Ich werde Ihnen helfen, herauszufinden, wonach Sie suchen müssen.

Maximum Likelihood ist eine Schätzmethode, die wir im Grunde genommen als M-Schätzer bezeichnen (stellen Sie sich das "M" als "Maximieren / Minimieren" vor). Wenn die für die Verwendung dieser Methoden erforderlichen Bedingungen erfüllt sind, können wir zeigen, dass die Parameterschätzungen konsistent und asymptotisch normalverteilt sind. Wir haben also:

N(θ^θ0)dNormal(0,A01B0A01),

wobei und einige Matrizen sind. Wenn wir die maximale Wahrscheinlichkeit verwenden, können wir zeigen, dass , und daher haben wir einen einfachen Ausdruck: Wir haben das wobei das bezeichnet. Dies ist, was Sie schätzen müssen, um Ihre Varianz zu erhalten.B 0 A 0 = B 0 A0B0A0=B0A0-E(H(θ0))H.

N(θ^θ0)dNormal(0,A01).
A0E(H(θ0))H

Ihr spezifisches Problem

Wie machen wir das? Nennen wir hier unseren Parameter vector was Sie tun: . Dies ist nur ein Skalar, daher ist unsere "Punktzahl" nur die Ableitung und die "Hessische" nur die Ableitung zweiter Ordnung. Unsere Wahrscheinlichkeitsfunktion kann wie folgt geschrieben werden: was wir maximieren möchten. Sie haben die erste Ableitung davon oder die Log-Wahrscheinlichkeit verwendet, um Ihr zu finden . Anstatt die erste Ableitung gleich Null zu setzen, können wir erneut differenzieren, um die Ableitung zweiter Ordnung . Zuerst nehmen wir Protokolle: Dann ist unsere 'Punktzahl': und unser 'Hessisch': p l ( p ) = ( p ) x (θpp H ( p )

l(p)=(p)x(1p)nx,
pH(p)l l ' ( p ) = x
ll(p)log(l(p))=xlog(p)+(nx)log(1p)
ll(p)=xp+nx1p,
H(p)=ll(p)=xp2nx(1p)2.
Dann sagt Ihnen unsere allgemeine Theorie von oben nur, dass Sie . Jetzt müssen Sie nur noch die Erwartung von (Hinweis: Verwenden Sie ), multiplizieren Sie mit und nehmen Sie die Umkehrung. Dann haben Sie Ihre Varianz des Schätzers.(E(H(p)))1H(p)E(x/n)=p1

Ist korrekt? Var(p)=p21n1np
Manu

@ Manu: Nicht ganz, aber es sieht so aus, als hättest du irgendwo einen kleinen Fehler gemacht. Kannst du noch ein paar Schritte posten?
pkofod

(E(H(p)))1=E(H(p))1]=(E(xp2)+E(nx(1p)2))1=(p2np+(1p)2(nnp))1 . Von da an vereinfachte ich durch Multiplikation und Umkehrung.
Manu

Das ist alles richtig, jetzt einfach vereinfachen. Im ersten Teil wird p abgebrochen, und im zweiten Teil können Sie n außerhalb der Klammer nehmen.
pkofod

2
(n/p+n/[1p])1 ist das, was Sie oben haben. Berechnen Sie einfach das heraus, setzen Sie einen gemeinsamen Nenner und nehmen Sie dann den Kehrwert. n
Ekvall

6

Lassen Sie uns zunächst den erwarteten Wert ausführen:

Wenn die Anzahl der Erfolge in Würfen ist, ist der Anteil der Erfolge in Ihrer Stichprobe. Betrachten Sie ; Für jeden Wurf beträgt die Erfolgswahrscheinlichkeit gemäß den Annahmen. Wenn Sie also die Münze einmal werfen, beträgt die erwartete "Anzahl der Erfolge" , richtig? Wenn Sie also die Münze mal werfen , würden Sie mal Erfolg erwarten, da die Würfe unabhängig sind. Da die Anzahl der erwarteten Erfolge in Würfen ist, erhalten Sien x / n E xxnx/nExpp×1+(1p)×0=pnnpnpn

Ep=En1x=n1Ex=n1×np=p

Der Schätzer ist also unvoreingenommen. Können Sie herausfinden, wie Sie die Varianz von hier aus durchführen können?

Edit: Lass uns auch die Varianz machen. Wir verwenden . Den zweiten Term haben wir bereits aus der Berechnung des erwarteten Wertes, also machen wir den ersten: Um einige zu vereinfachen können wir die Anzahl der Erfolge in Würfen wie folgt ausdrücken : wobei den Wert 1 annimmt, wenn der Wurf ein Erfolg war, und ansonsten 0. Daher ist Wenn Sie also die Dinge zusammenfügen, gelangen Sie zu .E p 2 = n - 2Var(p)=Ep2(Ep)2

Ep2=n2Ex2
n
x=1nχi,
χiiVar(p)=p(1-p)
Ex2=E(1nχi)2=E[1nχi2+2i<jχiχj]=np+n(n1)p2,
Var(p)=p(1p)n

Wenn Sie Köpfe hintereinander werfen , ist Ihr . Welchen genauen Wert würde Var ( ) jedoch annehmen? p M L E = 1,0 p n=3pMLE=1.0p
Piccolo
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.