Wahrscheinlichkeitsformel für eine multivariate Bernoulli-Verteilung


13

Ich benötige eine Formel für die Wahrscheinlichkeit eines Ereignisses in einer n-variablen Bernoulli-Verteilung mit gegebenen Wahrscheinlichkeiten für ein einzelnes Element und für Paare von Elementen . Entsprechend könnte ich Mittelwert und Kovarianz von angeben .X{0,1}nP(Xi=1)=piP(Xi=1Xj=1)=pijX

Ich habe bereits erfahren, dass es viele Verteilungen mit den Eigenschaften gibt, genauso wie es viele Verteilungen mit einem bestimmten Mittelwert und einer bestimmten Kovarianz gibt. Ich suche eine kanonische für , so wie der Gaußsche eine kanonische Verteilung für und ein gegebener Mittelwert und eine gegebene Kovarianz ist.{0,1}n{0,1}nRn

Antworten:


11

Die Zufallsvariable, die Werte in annimmt ,{0,1}n ist eine diskrete Zufallsvariable. Seine Verteilung wird vollständig durch die Wahrscheinlichkeiten pi=P(X=i) mit i{0,1}n . Die von Ihnen angegebenen Wahrscheinlichkeiten pi und pij sind Summen von pi für bestimmte Indizes i .

Nun scheint es, dass Sie beschreiben möchten, indem Sie nur p i und p i j verwenden . Es ist nicht möglich, ohne bestimmte Eigenschaften von p i anzunehmen . Um dies zu sehen, versuchen Sie, die charakteristische Funktion von X abzuleiten . Wenn wir n = 3 nehmen , bekommen wirpipipijpiXn=3

Es ist nicht möglich, diesen Ausdruck neu anzuordnen, so dassp i

Eei(t1X1+t2X2+t3X3)=p000+p100eit1+p010eit2+p001eit3+p110ei(t1+t2)+p101ei(t1+t3)+p011ei(t2+t3)+p111ei(t1+t2+t3)
piverschwinden. Für die Gaußsche Zufallsvariable hängt die charakteristische Funktion nur vom Mittelwert und den Kovarianzparametern ab. Charakteristische Funktionen definieren Verteilungen eindeutig, weshalb Gaußsch eindeutig beschrieben werden kann, indem nur Mittelwert und Kovarianz verwendet werden. Wie wir für die Zufallsvariable dies nicht der Fall.X

 


10

Siehe folgendes Papier:

JL Teugels, Einige Darstellungen der multivariaten Bernoulli- und Binomialverteilungen , Journal of Multivariate Analysis , vol. 32, nein. 2, Februar 1990, 256–268.

Hier ist die Zusammenfassung:

Multivariate, aber vektorisierte Versionen für Bernoulli- und Binomialverteilungen werden mit dem Konzept des Kronecker-Produkts aus der Matrixrechnung erstellt. Die multivariate Bernoulli-Verteilung beinhaltet ein parametrisiertes Modell, das eine Alternative zum herkömmlichen logarithmischen linearen Modell für binäre Variablen darstellt.


2
Danke, dass du das teilst, Hamed. Willkommen auf unserer Webseite!
Whuber

1

Ich weiß nicht, wie die resultierende Verteilung heißt oder ob sie überhaupt einen Namen hat, aber es scheint mir, dass der offensichtliche Weg, dies einzurichten, darin besteht, sich das Modell vorzustellen, das Sie zum Modellieren einer 2 × 2 × 2 × verwenden würden … × 2-Tabelle unter Verwendung eines log-linearen Modells (Poisson-Regression). Da Sie nur die Interaktionen 1. Ordnung kennen, ist es natürlich anzunehmen, dass alle Interaktionen höherer Ordnung Null sind.

Unter Verwendung der Notation des Fragestellers ergibt sich das Modell:

P(X1=x1,X2=x2,,Xn=xn)=i[pixi(1pi)1xij<i(pijpipj)xixj]

This formula has notational problems: there are p's on the left and the right. The right side makes no reference at all to the subscript i. Furthermore, still interpreting the pi as probabilities (as in the original question), the rhs clearly is positive whereas the lhs cannot be positive.
whuber

@whuber Quite right! I stick by the model I set out in the first para, but my equation was screwed up in several ways... Goes to show I haven't actually used log-linear modelling of contingency tables since my MSc, and I haven't got the notes or books to hand. I believe I've fixed it now though. Let me know if you agree! Apols for the delay. Some days my brain just doesn't do algebra.
onestop

1
I don't think this works. Assume pi=1/n and pij=0ij. This is a valid combination of probabilities, realized when I is a uniform random variable {1,...,n} and XI=1 and all Xj=0jI. Still the formula above would be 0 for all events. Still thanks for helping!
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.