Die Dirichlet-Verteilung ist eine multivariate Wahrscheinlichkeitsverteilung, die Variablen , so dass jedes und , das durch parametrisiert wird ein Vektor von Parametern mit positivem Wert . Die Parameter müssen keine ganzen Zahlen sein, sondern müssen nur positive reelle Zahlen sein. Sie sind in keiner Weise "normalisiert", sondern Parameter dieser Verteilung.X 1 , … , X k x i ≤ ( 0 , 1 ) ≤ N i = 1 x i = 1 α = ( α 1 , … , α k )k ≥ 2X1, … , Xkxich∈ ( 0 , 1 )∑Ni = 1xich= 1α = ( α1, … , Αk)
Die Dirichlet-Verteilung ist eine Verallgemeinerung der Beta-Verteilung in mehrere Dimensionen, sodass Sie zunächst etwas über die Beta-Verteilung lernen können. Beta ist eine univariate Verteilung einer Zufallsvariablen , die durch die Parameter und parametrisiert wird . Die gute Intuition kommt daher, wenn Sie sich daran erinnern, dass es sich um ein konjugiertes Prior für die Binomialverteilung handelt und wenn wir für den Wahrscheinlichkeitsparameter der Binomialverteilung ein Beta-Prior annehmen, das durch und parametrisiert ist , dann ist auch die posteriore Verteilung von a Betaverteilung parametrisiert vonα β α β p p α ' = α + Anzahl der Erfolge β ' = β + Anzahl der Ausfälle α βX∈ ( 0 , 1 )αβαβppα′= α + Anzahl der Erfolge und . Sie können sich also und als Pseudocounts (sie müssen keine ganzen Zahlen sein) von Erfolgen und Misserfolgen vorstellen (überprüfen Sie auch diesen Thread ).β′= β+ Anzahl der Ausfälleαβ
Bei der Dirichlet-Verteilung handelt es sich um ein Konjugat vor der Multinomialverteilung . Wenn wir im Falle der Binomialverteilung daran denken können, weiße und schwarze Kugeln mit Ersatz aus der Urne zu zeichnen, dann zeichnen wir im Falle der Multinomialverteilung mit Ersatz Kugeln, die in Farben erscheinen, wobei jede der Farben der Bälle können mit den Wahrscheinlichkeiten . Das Dirichlet - Verteilung ist ein Konjugat vor für Wahrscheinlichkeiten und Parameter können wie folgt beschrieben werden pseudocounts von Kugeln jeder Farbe angenommen Apriorik p 1 , ... , p k p 1 , ... , p k α 1 , ... , α k α 1 , ... , α k α 1 + n 1 , ... , α k + n kNkp1, … , Pkp1, … , Pkα1, … , Αk(aber Sie sollten auch über die Fallstricke solcher Überlegungen lesen ). Im Dirichlet-Multinomial-Modell sie aktualisiert, indem sie mit den beobachteten Zählwerten in jeder Kategorie summiert werden: ähnlich wie im Fall eines Beta-Binomial-Modells.α1, … , Αkα1+ n1, … , Αk+ nk
Der höhere Wert von , das größere "Gewicht" von und der größere Betrag der gesamten "Masse" werden ihm zugewiesen (man daran, dass es insgesamt ). Wenn alle gleich sind, ist die Verteilung symmetrisch. Wenn , kann dies als Anti-Gewicht betrachtet werden, das zu Extremen hin wegdrückt , während es zu einem zentralen Wert hin anzieht, wenn es hoch ist (zentral in dem Sinne, dass alle Punkte um ihn herum konzentriert sind, nicht in der spüren, dass es symmetrisch zentral ist). Wenn , sind die Punkte gleichmäßig verteilt.X i x 1 + ⋯ + x k = 1 α i α i < 1 x i x i α 1 = ⋯ = α k = 1αichXichx1+ ⋯ + xk= 1αichαich< 1xichxichα1= ⋯ = αk= 1
Dies ist in den folgenden Diagrammen zu sehen, in denen Sie trivariate Dirichlet-Verteilungen sehen können (leider können wir nur vernünftige Diagramme mit bis zu drei Dimensionen erstellen), die durch (a) , (b) , (c) , (d) .α 1 = α 2 = α 3 = 10 α 1 = 1 , α 2 = 10 , α 3 = 5 α 1 = α 2 = α 3 = 0,2α1= α2= α3= 1α1= α2= α3= 10α1= 1 , α2= 10 , α3= 5α1= α2= α3= 0,2
Die Dirichlet-Verteilung wird manchmal als "Verteilung über Verteilungen" bezeichnet , da sie als Verteilung der Wahrscheinlichkeiten selbst gedacht werden kann. Beachten Sie, dass , da jeder und , dann ‚s sind , die mit den ersten und zweiten Axiome der Wahrscheinlichkeit . Sie können die Dirichlet-Verteilung also als Wahrscheinlichkeitsverteilung für diskrete Ereignisse verwenden, die durch Verteilungen wie kategorial oder multinomial beschrieben werden . Es ist nicht≤ k i = 1 x i = 1 x i kxich∈ ( 0 , 1 )∑ki = 1xich= 1xichEs ist wahr, dass es sich um eine Verteilung über beliebige Verteilungen handelt. Beispielsweise bezieht es sich nicht auf Wahrscheinlichkeiten kontinuierlicher Zufallsvariablen oder sogar auf einige diskrete Variablen (z. B. beschreibt eine verteilte Poisson-Zufallsvariable Wahrscheinlichkeiten für die Beobachtung von Werten, bei denen es sich um beliebige natürliche Zahlen handelt, um a zu verwenden Dirichlet-Verteilung über ihre Wahrscheinlichkeiten, benötigen Sie eine unendliche Anzahl von Zufallsvariablen ).k