Visualisieren Sie die bivariate Binomialverteilung


11

Frage: Wie sieht eine bivariate Binomialverteilung im dreidimensionalen Raum aus?

Unten ist die spezifische Funktion, die ich für verschiedene Werte der Parameter visualisieren möchte; nämlich , p 1 und p 2 .np1p2

f(x1,x2)=n!x1!x2!p1x1p2x2,x1+x2=n,p1+p2=1.

Beachten Sie, dass es zwei Einschränkungen gibt. und p 1 + p 2 = 1 . Außerdem ist n eine positive ganze Zahl, z. B. 5 .x1+x2=np1+p2=1n5

In haben zwei Versuche unternommen, die Funktion mit LaTeX (TikZ / PGFPLOTS) zu zeichnen. Dabei erhalte ich die folgenden Diagramme für die folgenden Werte: , p 1 = 0,1 und p 2 = 0,9 und n = 5 , p 1 = 0,4 bzw. p 2 = 0,6 . Es ist mir nicht gelungen, die Einschränkung für die Domänenwerte zu implementieren. x 1 + x 2 = n , also bin ich ein bisschen ratlos.n=5p1=0.1p2=0.9n=5p1=0.4p2=0.6x1+x2=n

Eine in einer beliebigen Sprache erstellte Visualisierung würde gut funktionieren (R, MATLAB usw.), aber ich arbeite in LaTeX mit TikZ / PGFPLOTS.

Erster Versuch

, p 1 = 0,1 und p 2 =n=5p1=0.1p2=0.9

Geben Sie hier die Bildbeschreibung ein

Zweiter Versuch

, p 1 = 0,4 und p 2 = 0,6n=5p1=0.4p2=0.6

Geben Sie hier die Bildbeschreibung ein

Bearbeiten:

Als Referenz finden Sie hier einen Artikel mit einigen Grafiken. Der Titel des Papiers lautet "Eine neue bivariate Binomialverteilung" von Atanu Biswasa und Jing-Shiang Hwang. Statistics & Probability Letters 60 (2002) 231–240.

Bearbeiten 2: Aus Gründen der Übersichtlichkeit und als Antwort auf @GlenB in den Kommentaren finden Sie unten eine Momentaufnahme der Darstellung der Verteilung in meinem Buch. Das Buch bezieht sich nicht auf entartete / nicht entartete Fälle und so weiter. Es präsentiert es einfach so und ich habe versucht, es zu visualisieren. Prost! Wie von @JohnK hervorgehoben, gibt es wahrscheinlich auch einen Tippfehler in Bezug auf x1 + x1 = 1, der seiner Meinung nach x1 + x1 = n sein sollte.

Geben Sie hier die Bildbeschreibung ein

Bild der Gleichung aus:

Spanos, A (1986) Statistische Grundlagen der ökonometrischen Modellierung. Cambridge University Press


5
Aber es sollte nicht kontinuierlich sein, oder? Beide Zufallsvariablen sind diskret.
JohnK

1
X1 & x2 sind also unabhängig, stimmt das? Sie benötigen eine Pseudo-3D-Darstellung? Wäre eine Heatmap akzeptabel?
Gung - Reinstate Monica


2
@JohnK Wenn und p 1 + p 2 = 1, haben Sie es mit X 1Binomial ( n , p 1 ) zu tun (und X 2 ist einfach n - X 1 ). Dies ist ein univariates Binomial (oder, als bivariat betrachtet, entartet ). x1+x2=np1+p2=1X1Binomial(n,p1)X2nX1
Glen_b -State Monica

3
Sie haben keine Spezifikation für ein bivariates Binom in Ihrer Frage. (Es gibt mehr als eine Möglichkeit, eine bivariate Verteilung anzugeben, die plausibel als "Binomial" bezeichnet werden könnte. Sie haben keine davon, obwohl Ihre entartete ein Sonderfall für einige von ihnen wäre.) ... die Zeichnungen in Ihre Biswasa & Hwang-Referenz ist keine geeignete Anzeige einer diskreten bivariaten PMF. Kurz gesagt, Ihrer Frage fehlt etwas zum Zeichnen, und Ihre Referenz ist hauptsächlich als Beispiel dafür nützlich, was Sie vermeiden sollten.
Glen_b -State Monica

Antworten:


8

Dazu gibt es zwei Teile: Zuerst müssen Sie herausfinden, wie hoch die einzelnen Wahrscheinlichkeiten sind, und dann müssen Sie sie irgendwie darstellen.

Eine binomiale PMF ist nur eine Reihe von Wahrscheinlichkeiten über eine Reihe von "Erfolgen". Eine bivariate binomiale PMF ist eine Reihe von Wahrscheinlichkeiten über ein Raster möglicher Kombinationen von "Erfolgen". In Ihrem Fall haben Sie , also ( wenn man bedenkt, dass 0 Erfolge möglich sind) gibt es 6 × 6 = 36ni=nj=506×6=36 möglich mögliche Ergebnisse in der Gitter / bivariaten Binomialverteilung.

Wir können zuerst die marginalen binomischen PMFs berechnen, weil das so einfach ist. Da die Variablen unabhängig sind, ist jede gemeinsame Wahrscheinlichkeit nur das Produkt der Grenzwahrscheinlichkeiten; Das ist Matrixalgebra. Hier demonstriere ich diesen Prozess mit RCode:

b1 = dbinom(0:5, size=5, prob=0.1);  sum(b1)  # [1] 1
b9 = dbinom(0:5, size=5, prob=0.9);  sum(b9)  # [1] 1
b4 = dbinom(0:5, size=5, prob=0.4);  sum(b4)  # [1] 1
b6 = dbinom(0:5, size=5, prob=0.6);  sum(b6)  # [1] 1

b19 = b1%o%b9;  sum(b19)  # [1] 1
rownames(b19) <- colnames(b19) <- as.character(0:5)
round(b19, 6)
#       0        1        2        3        4        5
# 0 6e-06 0.000266 0.004783 0.043047 0.193710 0.348678
# 1 3e-06 0.000148 0.002657 0.023915 0.107617 0.193710
# 2 1e-06 0.000033 0.000590 0.005314 0.023915 0.043047
# 3 0e+00 0.000004 0.000066 0.000590 0.002657 0.004783
# 4 0e+00 0.000000 0.000004 0.000033 0.000148 0.000266
# 5 0e+00 0.000000 0.000000 0.000001 0.000003 0.000006
b46 = b4%o%b6;  sum(b46)  # [1] 1
rownames(b46) <- colnames(b46) <- as.character(0:5)
round(b46, 3)
#       0     1     2     3     4     5
# 0 0.001 0.006 0.018 0.027 0.020 0.006
# 1 0.003 0.020 0.060 0.090 0.067 0.020
# 2 0.004 0.027 0.080 0.119 0.090 0.027
# 3 0.002 0.018 0.053 0.080 0.060 0.018
# 4 0.001 0.006 0.018 0.027 0.020 0.006
# 5 0.000 0.001 0.002 0.004 0.003 0.001

Zu diesem Zeitpunkt haben wir die beiden erforderlichen Wahrscheinlichkeitsmatrizen. Wir müssen nur entscheiden, wie wir sie zeichnen wollen. Um ehrlich zu sein, bin ich kein großer Fan von 3D-Balkendiagrammen. Da Rscheint mir zuzustimmen, habe ich diese Diagramme in Excel erstellt:

b19::

Geben Sie hier die Bildbeschreibung ein

b46::

Geben Sie hier die Bildbeschreibung ein


Vielen Dank für die Präsentation plus R-Code. Dies führt mich dazu, nach x1 + x2 = n zu fragen. Wenn diese Bedingung zutrifft, sollte es nur eine einzige Reihe von Säulen geben, wie hier dargestellt: reference.wolfram.com/language/ref/MultinomialDistribution.html Das Wolfram-Diagramm, von dem ich annehme, ist das, was @Glen_b als entarteten Fall bezeichnet hat? Bedeutet dies, dass Sie den nicht entarteten Fall vorgestellt haben?
Graeme Walsh

1
GraemeWalsh, meine Präsentation zeigt kein bivariates Binom mit x1 + x2 = n. Wie @Glen_b in den Kommentaren und seiner Antwort ausführlich besprochen hat, würde ich das nicht wirklich als "bivariate Binomialverteilung" bezeichnen, ohne sie zu qualifizieren. Darüber hinaus würde dies bedeuten, dass x1 & x2 nicht unabhängig sind, wie Sie in Ihrem Antwortkommentar gesagt haben, sondern vollkommen abhängig. In Wahrheit habe ich nicht bemerkt, dass dies eine so bizarre Variante ist (Sie können mir die Schuld geben, dass ich nicht genau genug gelesen habe). Wie Glen_b gezeigt hat, wäre diese Version eine einzelne Säulenreihe. Was ich vorstellte, war der nicht entartete Fall.
Gung - Reinstate Monica

@gung Ich mag deine neuen Handlungen. Ich denke, Ihre Diskussion deckt den entarteten Fall ganz gut ab ("Sie müssen herausfinden, was die einzelnen Wahrscheinlichkeiten sind" sagt wirklich alles; die tatsächlichen Berechnungen für den entarteten Fall sind trivial); Ich habe gerade diese trivialen Berechnungen durchgeführt.
Glen_b -Reinstate Monica

7

Die Antwort von gung ist eine gute Antwort auf ein tatsächliches bivariates Binomial, das die Probleme gut erklärt (ich würde empfehlen, sie als gute Antwort auf die Titelfrage zu akzeptieren, die höchstwahrscheinlich für andere nützlich ist).

x1n

Also lasst uns die Dinge richtig definieren. Beachten Sie, dass tatsächlich keine Definition der Zufallsvariablen angeboten wird, sodass wir nur noch Vermutungen anstellen müssen.

Y1binomial(n,p1),P(Y1=y1)y1y1=0,1,...,nX1=Y1/nx1=0,16,26,...,1

P(X1=x1)x2=nx1p2=1p1

n=6,p1=0.3

enter image description here

x2x11x1x2 .

Wir könnten es als (skaliertes) entartetes bivariates Binom betrachten:

enter image description here

Aber es ist ein bisschen schwierig, das, was in dem Buch definiert ist, wirklich als bivariates Binomial zu bezeichnen (da es praktisch ein univariates Binomial ist).

Unter der Annahme, dass jemand ein ähnliches Diagramm wie das 3D-Diagramm erstellen möchte, kommt dieses kleine Stück (R) -Code dem zweiten Diagramm oben ziemlich nahe:

y = 0:6
x1 = y/6
x2 = 1-x1
p = dbinom(y,6,.3)
scatterplot3d(x1,x2,p,grid=TRUE, box=FALSE, cex.lab=1.2,
        color=3, cex.main=1.4,pch=21,bg=1,, type="h",angle=120,
        main="degenerate scaled binomial", ylab="x2", xlab="x1", 
        zlab="prob")

(Du brauchst das scatterplot3d Paket, das die gleichnamige Funktion enthält.)

Ein "wahres" (nicht entartetes) bivariates Binomial variiert beide Variablen gleichzeitig. Hier ist ein Beispiel für eine bestimmte Art von bivariatem Binom (in diesem Fall nicht unabhängig). Ich habe auf verschiedene Farben in der Handlung zurückgegriffen, weil es sonst zu leicht ist, sich im Wald der "Stöcke" zu verirren.

enter image description here

Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+YX2=X+Z .

X1X2

n0nynz=Xx1=x2x1+x2=n

[1]: Hamdan, MA (1972),
"Kanonische Erweiterung der bivariaten Binomialverteilung mit ungleichen Randindizes"
International Statistical Review , 40 : 3 (Dez.), S. 277-280


corr(X1,X2)=1

Glen_b. Vielen Dank. Es war sehr hilfreich darauf hinzuweisen, dass das von mir präsentierte mathematische Objekt (das mir präsentiert wurde!) Ein (skaliertes) entartetes bivariates Binom ist! Das wusste ich von Anfang an nicht. Zum Schluss noch eine elementare Anfrage! Wäre es Ihnen möglich, explizit (in mathematischer Notation) anzugeben, wie Sie ein wahres oder tatsächliches bivariates Binom definieren? Das wäre nützlich, denke ich.
Graeme Walsh

1
Xbin(n0,p)Ybin(ny,p)Zbin(nz,p)X1=X+Y undX.2=X.+Z.. ... ctd
Glen_b -Reinstate Monica

1
ctd ... Dies ergibt ein Binomial X.1 und X.2die korreliert sind, aber den Nachteil haben, dass sie keine negativen Korrelationen erzeugen, so dass sie für die allgemeine bivariate Modellierung nicht so nützlich sind wie einige andere Formulierungen des bivariaten Binomials. Wenn Sie eine univariate Verteilungsfamilie auf eine bivariate verallgemeinern, müssen Sie normalerweise auswählen, welche Eigenschaften Sie am meisten möchten und welche Sie sich leisten können, aufzugeben. Diese Auswahl führt zu unterschiedlichen Auswahlen von bivariaten Familien. [Die Normalverteilung ist ungewöhnlich - es gibt eine "offensichtliche" Verallgemeinerung mit so ziemlich allem, was wir wollen.]
Glen_b -Reinstate Monica

@ Graeme ... Ich habe vor, weitere Details hinzuzufügen.
Glen_b -State Monica

4

Mathematicaist jetzt ziemlich stark in solchen Dingen - es hat die Lösung Ihres Problems direkt in der Dokumentation . Mit kleinen Ergänzungen habe ich ein Modell zum Herumspielen gemacht (mit p = p1 = 0.4für eine bessere visuelle Präsentation). So sieht die Schnittstelle aus und kann gesteuert werden.

enter image description here

Snippet

Manipulate[
 Grid[{
   {DiscretePlot3D[
     PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right],

    DiscretePlot3D[
     CDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], {x, 0, 
      n}, {y, 0, n}, PlotLabel -> Row[{"n = ", n}], 
     ExtentSize -> Right]}
   }]
 ,
 {{n, 5}, 1, 20, 1, Appearance -> "Labeled"},
 {{p, 0.4}, 0.1, 0.9},
 TrackedSymbols -> True
 ]

Die Hauptsache hier ist PDF[MultinomialDistribution[n, {p, 1 - p}], {x, y}], was selbsterklärend ist, denke ich. Multinomialbedeuten nur, dass Sie pifür jede Variable eine Menge Verteilungen für jede Variable vornehmen können. Die einfache Form ist BinomialDistribution. Natürlich könnte ich es manuell machen, aber die Regel ist, wenn Sie eine eingebaute Funktion haben - Sie sollten es verwenden.

Wenn Sie Kommentare zur Codestruktur benötigen, lassen Sie es mich bitte wissen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.