Abschätzung der Kovarianz-Posterior-Verteilung eines multivariaten Gaußschen


15

Ich muss die Verteilung eines bivariaten Gaußschen mit wenigen Stichproben "lernen", aber eine gute Hypothese zur vorherigen Verteilung, also möchte ich den Bayes'schen Ansatz verwenden.

Ich habe meinen Prior definiert:

P(μ)N(μ0,Σ0)
μ0=[00]   Σ0=[160027]

Und meine Verteilung erhält die Hypothese

P(x|μ,Σ)N(μ,Σ)
μ=[00]   Σ=[180018]

Jetzt weiß ich dank hier, dass man den Mittelwert anhand der Daten schätzen kann

P(μ|x1,,xn)N(μ^n,Σ^n)

Ich kann berechnen:

μ^n=Σ0(Σ0+1nΣ)1(1ni=1nxi)+1nΣ(Σ0+1nΣ)1μ0

Σ^n=1nΣ0(Σ0+1nΣ)1Σ

Nun kommt die Frage, vielleicht liege ich falsch, aber es scheint mir, dass nur die Kovarianzmatrix für den geschätzten Parameter ist und nicht die geschätzte Kovarianz meiner Daten. Was ich gerne hätte wäre auch zu rechnenμ nΣnμn

P(Σn1|x1,,xn)

um eine vollständige Verteilung aus meinen Daten lernen zu lassen.

Ist das möglich? Wird es bereits durch das Berechnen von gelöst und wird die obige Formel nur falsch ausgedrückt (oder ich interpretiere sie einfach falsch)? Hinweise würden geschätzt. Danke vielmals.Σn

BEARBEITEN

Aus den Kommentaren ging hervor, dass mein Ansatz "falsch" war, in dem Sinne, dass ich eine konstante Kovarianz annahm, definiert durch . Was ich brauche, wäre, auch einen Prior darauf zu setzen, , aber ich weiß nicht, welche Distribution ich verwenden soll und wie ich sie anschließend aktualisiere.P ( Σ )ΣP(Σ)


Sie haben die Kovarianz Ihrer Daten bereits als - und Sie haben keine vorherige Verteilung angegeben, damit diese aktualisiert wird von? Σ=[180018]
Corone

Ich verstehe dein Argument. Bei meinem Ansatz ging ich also grundsätzlich davon aus, dass die Varianz konstant und spezifiziert war. Wenn ich es einschätzen will, brauche ich eine Voranmeldung. Nun ist mein Problem, dass es nicht klar ist, wie es geht definieren Sie es, und was wäre eine angemessene Verteilung dafür, aber dies scheint aus dem Rahmen der ersten Frage zu sein. P(Σ)F(μΣ,ΣΣ)
Unziberla

Dann ändern Sie die Frage :-)
Corone

Antworten:


11

Sie können Bayes'sche Aktualisierungen für die Kovarianzstruktur in etwa der gleichen Weise durchführen, wie Sie den Mittelwert aktualisiert haben. Das vorrangige Konjugat für die Kovarianzmatrix der multivariaten Normalen ist die Inverse-Wishart-Verteilung. Es ist also sinnvoll, dort zu beginnen.

P(Σ)W1(Ψ,ν)

Wenn Sie dann Ihr Stichproben- der Länge , können Sie die Stichproben-Kovarianzschätzung berechnen. n X = 1XnΣX=1n(Xμ)(Xμ)

Dies kann dann verwendet werden, um Ihre Schätzung der Kovarianzmatrix zu aktualisieren

P(Σ|X)W1(nΣX+Ψ,n+ν)

Sie können den Mittelwert als Punktschätzung für die Kovarianz verwenden (Posterior Mean Estimator).

E[Σ|X]=nΣX+Ψν+np1

oder Sie wählen den Modus (Maximum A Posteriori Estimator)

Mode[Σ|X]=nΣX+Ψν+n+p+1


Danke vielmals. Jetzt gehe ich davon aus, dass sich etwas an meinem Schätzprozess ändern wird. Als ersten Schritt sollte ich die Kovarianz mit Ihrer Prozedur abschätzen, dann lautet meine Verteilung unter der geschätzten Hypothese und da geschätzt wird und eine eigene Verteilung hat, bin ich mir ziemlich sicher, dass dies irgendwie meine vorherige Formel ändern wird, um zu berechnen. (wie es beim Gaußschen MLE bei Verwendung der Stichprobenvarianz der Fall ist). P(X|& mgr;, Σ ) Σ & mgr; nΣ^P(X|μ,Σ^)Σ^μ^n
Unziberla

Der von Ihnen beschriebene Ansatz wäre stattdessen die Verwendung von so dass ich einen tatsächlichen Wert für die Kovarianz habe, als ob ich es vorher gewusst hätte. In einem frequentistischen Ansatz würde dies falsch klingen, aber vielleicht fehlt mir etwas an der Tatsache, dass ich davon ausgehe, dass der Prior bekannt ist und dies das Verfahren korrekt macht? Σ^=E[Σ|x1xn]
Unziberla

7

Ok, ich habe die richtige Lösung für mein Problem gefunden. Ich poste es, auch wenn die richtige Antwort auf meine (verlegte) Frage die ausgewählte ist.

Grundsätzlich erklärt meine Frage, wie man den Mittelwert unter Kenntnis der Kovarianz abschätzt und wie man den Mittelwert unter Kenntnis der Kovarianz abschätzt. Mein eigentliches Problem war jedoch die Schätzung mit beiden unbekannten Parametern.

Ich habe die Antwort auf Wikipedia mit der hier erläuterten Ableitung gefunden . Der konjugierte Prior der multivariaten Normalen ist der Normal-Inverse-Wishart, dh eine Verteilung über multivariate Normalen.

Die vorherigen Parameter, die angegeben werden müssen, sind , um den Mittelwert zu definieren, , um die Kovarianz zu definieren, und zwei Skalarwerte und , die ich sagen würde, definieren, wie sicher wir sind auf die Schätzung der ersten beiden Parameter.Ψ κ 0 ν 0μ0Ψκ0ν0

Die aktualisierte Verteilung nach Beobachtung von Abtastwerten einer Variablen Normal hat die Formpnp

P(μ,Σ|X)NIW(κ0μ0+nx¯κ0+n,κ0+n,ν0+n,Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)T)

wo

x¯=1ni=0nxi

C=i=1n(xix¯)(xix¯)T

Also meine gewünschten geschätzten Parameter sind

E(Σ|X)=Ψ+C+κ0n

E(μ|X)=κ0μ0+nx¯κ0+n
E(Σ|X)=Ψ+C+κ0nκ0+n(x¯μ0)(x¯μ0)Tν0+np1
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.