Die "Standard" -Verteilung, die am häufigsten verwendete und beschriebene Verteilung der Wahl für Zähldaten, ist die Poisson-Verteilung . Am häufigsten wird es am Beispiel seiner ersten praktischen Anwendung veranschaulicht:
Eine praktische Anwendung dieser Verteilung wurde 1898 von Ladislaus Bortkiewicz vorgenommen, als er die Aufgabe erhielt, die Anzahl der Soldaten in der preußischen Armee zu untersuchen, die versehentlich durch Tritte von Pferden getötet wurden. Dieses Experiment führte die Poisson-Verteilung in das Gebiet der Zuverlässigkeitstechnik ein.
λλ
E(Y|X,β)=λ=exp(β0+β1X1+⋯+βkXk)
λ
Das Problem bei der Verwendung der Poisson-Verteilung für die realen Daten besteht darin, dass davon ausgegangen wird, dass der Mittelwert der Varianz entspricht. Ein Verstoß gegen diese Annahme wird als Überdispersion bezeichnet . In solchen Fällen können Sie immer ein Quasi-Poisson- Modell, ein logarithmisches Nicht-Poisson-Modell (für große Zählungen kann Poisson durch Normalverteilung angenähert werden), eine negative binomiale Regression (eng verwandt mit Poisson; siehe Berk und MacDonald, 2008) oder verwenden andere Modelle, wie von Stephan Kolassa beschrieben .
Für eine freundliche Einführung in die Poisson-Regression können Sie auch Artikel von Lavery (2010) oder Coxe, West und Aiken (2009) lesen.
Lavery, R. (2010). Ein animierter Leitfaden: Eine Einführung in die Poisson-Regression. NESUG-Papier, sa04.
Coxe, S., West, SG & Aiken, LS (2009). Die Analyse von Zähldaten: Eine sanfte Einführung in die Poisson-Regression und ihre Alternativen. Journal of Personality Assessment, 91 (2), 121-136.
Berk, R. & MacDonald, JM (2008). Überdispersion und Poisson-Regression. Journal of Quantitative Criminology, 24 (3), 269 & ndash; 284.