Entschuldigung für die späte Antwort, aber das nervte mich auch und ich fand die Antwort. Die Verteilung ist in der Tat Dirichlet-Multinomial und das individuelle Neg. Binomialverteilungen müssen nicht einmal identisch sein, solange ihr Fano-Faktor (Verhältnis von Varianz zu Mittelwert) identisch ist.
Lange Antwort:
Wenn Sie NB wie folgt parametrieren:
p(X=x|λ,θ)=NB(x|λ,θ)=(θ−1λ+x−1x)(11+θ−1)x(θ−11+θ−1)θ−1λ
Dann ist und undE(X)=λVar(X)=λ(1+θ)
∀i:Xi∼NB(λi,θ) impliziert
∑Xi∼NB(∑λi,θ)
Nehmen Sie dann die Wahrscheinlichkeit unter Berücksichtigung der Summe:
∏NB(xi|λi,θ)NB(∑xi|∑λi,θ)=(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi∏(θ−1λi+xi−1xi)(11+θ−1)∑xi(θ−11+θ−1)θ−1∑λi(θ−1∑λi+∑xi−1∑xi)==Γ(∑xi+1)Γ(θ−1∑λi)Γ(θ−1∑λi+∑xi)∏Γ(θ−1λi+xi)Γ(xi+1)Γ(θ−1λi)=DM(x1,...,xn|θ−1λ1,...,θ−1λn)
wobei die Dirichlet-Multinomial-Wahrscheinlichkeit ist. Dies ergibt sich einfach aus der Tatsache, dass sich mit Ausnahme der Multinomialkoeffizienten viele Terme im Bruch auf der linken Seite aufheben und Sie nur die Gammafunktionsterme erhalten, die zufällig mit der DM-Wahrscheinlichkeit identisch sind.DM
Beachten Sie auch, dass die Parameter dieses Modells nicht als Zunahme von bei gleichzeitiger Abnahme von allen identifizierbar sind, was zu genau der gleichen Wahrscheinlichkeit führt.θλi
Die beste Referenz, die ich dafür habe, sind die Abschnitte 2 bis 3.1 von Guimarães & Lindrooth (2007): Kontrolle der Überdispersion in gruppierten bedingten Logit-Modellen: Eine rechnerisch einfache Anwendung der Dirichlet-multinomialen Regression - sie ist leider kostenpflichtig, aber ich konnte nicht Finden Sie eine nicht paywalled Referenz.