Die negative Binomialverteilung hat sich in der Bioinformatik zu einem beliebten Modell für Zähldaten (insbesondere die erwartete Anzahl von Sequenzierungslesevorgängen innerhalb einer bestimmten Region des Genoms aus einem bestimmten Experiment) entwickelt. Erklärungen variieren:
- Einige erklären es als etwas, das wie die Poisson-Verteilung funktioniert, aber einen zusätzlichen Parameter hat, der mehr Freiheit bei der Modellierung der wahren Verteilung bietet, wobei die Varianz nicht unbedingt dem Mittelwert entspricht
- Einige erklären es als gewichtete Mischung von Poisson-Verteilungen (mit einer Gamma-Mischungsverteilung auf dem Poisson-Parameter)
Gibt es eine Möglichkeit, diese Gründe mit der traditionellen Definition einer negativen Binomialverteilung in Einklang zu bringen, indem die Anzahl der Erfolge von Bernoulli-Versuchen modelliert wird, bevor eine bestimmte Anzahl von Fehlern festgestellt wird? Oder sollte ich es einfach als glücklichen Zufall betrachten, dass eine gewichtete Mischung von Poisson-Verteilungen mit einer Gamma-Mischungsverteilung dieselbe Wahrscheinlichkeitsmassenfunktion wie das negative Binom hat?