Ich habe einen Datensatz, der die Anzahl der Aktionen enthält, die von Einzelpersonen innerhalb von 7 Tagen ausgeführt wurden. Die spezifische Aktion sollte für diese Frage nicht relevant sein. Hier einige beschreibende Statistiken für den Datensatz:
Hier ist ein Histogramm der Daten:
Nach der Datenquelle zu urteilen, dachte ich, dass es zu einer Poisson-Verteilung passen würde. Die mittlere ≠ Varianz und das Histogramm sind jedoch stark nach links gewichtet. Zusätzlich habe ich den goodfit
Test in R durchgeführt und Folgendes erhalten:
> gf <- goodfit(actions,type="poisson", method = "MinChisq") <br>
> summary(gf) <br>
Goodness-of-fit test for poisson distribution <br>
X^2 df P(> X^2) <br>
Pearson 2.937599e+248 771 0
Die Maximum-Likelihood-Methode ergab auch einen p-Wert = 0. Unter der Annahme, dass die Nullhypothese lautet: Die Daten stimmen mit einer Poisson-Verteilung überein (die Dokumentation gibt dies nicht an), goodfit
sagt der Test, dass wir die Nullhypothese ablehnen sollten, daher tun die Daten dies nicht eine Poisson-Verteilung abgleichen.
Ist diese Analyse korrekt? Wenn ja, welche Verteilung passt Ihrer Meinung nach zu diesen Daten?