Proben aus einer endlichen Mischung von Normalverteilungen ziehen?


10

Nach einigen Bayes'schen Aktualisierungsschritten bleibt mir eine hintere Verteilung der Form einer Mischung von Normalverteilungen,Das heißt, der Parameter \ theta wird aus einer Verteilung gezogen, deren PDF als gewichtete Mischung normaler PDFs angegeben wird und keine Summe normaler RVs ist. Ich möchte Stichproben \ theta \ sim \ Pr (\ theta | \ text {data}) zeichnen , um sie in einer wichtigen Stichprobenannäherung dieses Seitenzahns zu verwenden. In der Praxis kann die Summe über i eine große Anzahl von Begriffen haben, so dass es unpraktisch sein kann, einen Begriff i gemäß den Gewichten \ {w_i \} zu wählen und dann \ theta \ sim N (\ mu_i, \ sigma ^ zu zeichnen 2)

Pr(θ|data)=i=1kwiN(μi,σ2).
θθPr(θ|data)ii{wi}θN(μi,σ2). Gibt es eine effiziente Möglichkeit, Proben von einem Posterior dieser Form zu ziehen?

Haben Sie tatsächlich die Methode select then throw ausprobiert? Die Auswahl kann relativ schnell von O (k) Schritten getroffen werden.
dmckee --- Ex-Moderator Kätzchen

1
Wenn Barrons Lösung wirklich nicht korrekt ist und Sie tatsächlich ein "Mischungsmodell" meinen, könnten Sie bitte diesen Begriff verwenden?
Neil G

1
Neil G: Ich bin kein Statistiker von Beruf, sondern ein Physiker, der manchmal Statistiken verwenden muss. Daher kannte ich den passenden Begriff nicht, um zu beschreiben, was ich brauchte. Ich kann die Frage jetzt jedoch bearbeiten, um klarer zu machen, dass die PDFs summiert werden und nicht die Wohnmobile.
Chris Granade

1
@ ChrisGranade: Ich habe nicht versucht, auf dich runterzukommen. Ich wollte nur sicherstellen, dass Sie das gemeint haben, und die Bearbeitung vorschlagen.
Neil G

1
Warum ist es unpraktisch, basierend auf den Gewichten und einer Stichprobe aus der Gleichverteilung auf und dann Stichprobe zu wählen ? Dies ist nur mäßig teurer als das Abtasten einer einzelnen Normalverteilung, die Kosten sind unabhängig von der Anzahl der gemischten Verteilungen und beruhen nicht darauf, dass diese Verteilungen normal sind. i{wi}[0,1]N(μi,σ2)k
Jed Brown

Antworten:


6

Im Prinzip könnte man die Anzahl der Proben, die aus jeder Unterverteilung gezogen werden sollen, vorwählen, dann jede Unterverteilung nur einmal besuchen und dann mehr als die Anzahl der Punkte ziehen.

Das ist

  1. Finden Sie die Zufallsmenge so, dass und respektieren Sie die Gewichte.<n1,n2,,nk>n=i=1kni

    Ich glaube, dass Sie dies tun, indem Sie eine Poisson-Verteilung mit einer Multinomialverteilung (siehe Kommentare) des Mittelwerts für jede Unterverteilung und dann die Summe auf normalisieren .winn

    Die Arbeit hier istO(k)O(n)

  2. Dann mach

    for (i=1; i<=k; ++i)
       for (j=1; j<=n[i]; ++j)
          theta ~ N(mu[i],sigma[i])
    

    Die Arbeit hier istO(n)

Dies bedeutet jedoch, dass Sie die nicht in zufälliger Reihenfolge erhalten. Wenn eine zufällige Reihenfolge erforderlich ist, müssen Sie die Ziehungen mischen (auch big ).O(n)

Es sieht so aus, als ob der erste Schritt in der Laufzeit dominiert und in der gleichen Reihenfolge wie der naive Algorithmus ist. Wenn Sie jedoch sicher sind, dass alle Sie die Poisson-Verteilungen mit Normalverteilungen approximieren und den ersten Schritt beschleunigen.win1


Die Verteilung von ist keine Poisson-Verteilung, wenn fest ist, sondern eine Binomialverteilung. nin
Frédéric Grosshans

@ FrédéricGrosshans Ähm ... hier gebe ich meine quälende Wahrscheinlichkeitsschwäche zu. Ich denke, Sie haben vielleicht Recht. Ich habe keinen Link zum Werfen beliebiger Binomialverteilungen, aber Wikipedia hat einige Referenzen . Es gibt auch eine Beziehung zwischen Poisson und Binomial, von der ich behaupten werde, dass sie für meine Unsicherheit verantwortlich war. Ja, das ist das Ticket.
dmckee --- Ex-Moderator Kätzchen

1
@dmckee: Gute Antwort für das Zeichnen aus einem Mischungsmodell, außer dass es in Schritt 1 eher eine multinomiale Verteilung als eine Poisson-Verteilung sein sollte.
Neil G

3

Hinweis: In der Originalversion dieser Frage wurde nach einer "gewichteten Summe von Normalverteilungen" gefragt, auf die die folgende Antwort hilfreich sein könnte. Nach einer guten Diskussion über diese Antwort, die Antwort von @Geoff und die Frage selbst wurde jedoch klar, dass es sich bei der Frage tatsächlich um eine Stichprobe einer "Mischung von Normalverteilungen" handelte, auf die diese Antwort nicht anwendbar ist.


Die Summe der Normalverteilungen ist eine Normalverteilung, sodass Sie die Parameter dieser Einzelverteilung berechnen und dann einfach Stichproben daraus ziehen können. Wenn wir diese Verteilung dannN(μsum,σsum2)

μsum=i=1kwiμi

σsum2=i=1kwi2σi2

3
Um es kurz zu machen, Chris summiert Wahrscheinlichkeitsdichtefunktionen, keine Zufallsvariablen.
Geoff Oxberry

2
Chris möchte ein PDF, das (zumindest im Prinzip) mehrere Unebenheiten enthält. Das heißt, er war die Summe der PDFs, nicht die PDF einer Summe.
dmckee --- Ex-Moderator Kätzchen

1
Es ist wahr, dass die Summe der normalverteilten Zufallsvariablen selbst eine normalverteilte Zufallsvariable ist. Die Summe der Normalverteilungen ist jedoch keine Normalverteilung. Wenn also und , es ist wahr, dass , aber . (Gutschrift geht an @ChrisGranade für die Erklärung.)X1N(μ1,σ12)X2N(μ2,σ22)X1+X2N(μ1+μ2,σ12+σ22)PDF(X1+X2)PDF(X1)+PDF(X2)
Geoff Oxberry

2
@dmckee: das ist keine "gewichtete Summe von Normalverteilungen", das ist eine "Mischung von Normalverteilungen".
Neil G

2
@ Barron-Kommentare werden nicht als wesentlicher Bestandteil der Seite angesehen. Sie sollten Ihre Antwort auf jeden Fall so bearbeiten, dass sie den Kern der Kommentare enthält, damit Leser, die sich die Kommentare nicht ansehen, nicht irregeführt werden.
David Ketcheson

2

Update : Diese Antwort ist falsch und beruht auf Verwirrung in der Terminologie (Einzelheiten finden Sie in der Kommentarkette unten). Ich lasse es nur als Wegweiser, damit die Leute diese Antwort nicht erneut veröffentlichen (außer Barron). Bitte stimmen Sie nicht nach oben oder unten ab.

Ich würde nur Eigenschaften von Zufallsvariablen verwenden, um sie auf eine einzelne normalverteilte Zufallsvariable zu reduzieren. Die Summe zweier unabhängiger, normalverteilter Zufallsvariablen ist selbst eine Zufallsvariable. Wenn also und dannX1N(μ1,σ12)X2N(μ2,σ22)

X1+X2N(μ1+μ2,σ12+σ22).

Auch wenn , dannw1R

w1X1N(w1μ1,w12σ12).

Dann werden diese beiden Ergebnisse kombiniert

Pr(θ|data)N(i=1kwiμi,i=1kwi2σi2).

In diesem Fall müssen Sie also nur Proben aus einer einzelnen Verteilung ziehen, was viel einfacher zu handhaben sein sollte.


2
Dies ist die Lösung für ein anderes Problem, das sich aus der Tatsache ergibt, dass die ursprüngliche Distribution multimodal und Ihr Vorschlag unimodal ist.
Chris Ferrie

@ChrisFerrie: Ich glaube Ihnen, aber basierend auf der Notation bin ich verwirrt darüber, warum die obige Verteilung multimodal wäre, während die Summe zweier unabhängiger Gaußscher Zufallsvariablen dies nicht wäre. Was fehlt mir hier?
Geoff Oxberry

Ich denke, die Verwirrung ist, dass wir nicht eine Summe von Zufallsvariablen betrachten, sondern ein PDF, das die Summe vieler PDFs ist. Diese sind nicht immer gleich, da . Stattdessen kann unser PDF als Marginalisierung gegenüber der Zufallsvariablen . p(X1+X2)p(X1)+p(X2)i
Chris Granade

Ah, Sie sehen sich PDF-Summen an. Ja, das ist ein ganz anderes Tier. Nachdem ich die Frage genauer gelesen habe, sehe ich, was Sie sagen, und ich werde meine Antwort löschen. Vielen Dank!
Geoff Oxberry

Ich habe meine zuvor gelöschte Antwort nur gelöscht, um anderen als Wegweiser zu dienen, damit niemand diese Frage so beantwortet wie Barron und ich. Bitte stimmen Sie meine Antwort nicht mehr ab.
Geoff Oxberry
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.