Überprüfung, ob zwei Poisson-Proben den gleichen Mittelwert haben


30

Dies ist eine elementare Frage, aber ich konnte die Antwort nicht finden. Ich habe zwei Messungen: n1 Ereignisse zum Zeitpunkt t1 und n2 Ereignisse zum Zeitpunkt t2, die beide durch Poisson-Prozesse mit möglicherweise unterschiedlichen Lambda-Werten erzeugt werden.

Dies ist eigentlich aus einem Nachrichtenartikel, der im Wesentlichen behauptet, dass seit die beiden unterschiedlich sind, aber ich bin nicht sicher, ob die Behauptung gültig ist. Angenommen, die Zeiträume wurden nicht böswillig ausgewählt (um die Ereignisse in dem einen oder anderen zu maximieren).n1/t1n2/t2

Kann ich einfach einen t- Test machen, oder wäre das nicht angebracht? Die Anzahl der Ereignisse ist zu gering, um die Verteilungen als ungefähr normal zu bezeichnen.



1
Feines Exemplar des Wissenschaftsjournalismus, da ...
Matt Parker

1
Ja ... Sie können sehen, warum ich die verwendeten Statistiken überprüfen wollte.
Charles

Antworten:


25

Um den Poisson-Mittelwert zu testen, wurde die bedingte Methode von Przyborowski und Wilenski (1940) vorgeschlagen. Die bedingte Verteilung von X1 bei X1 + X2 folgt einer Binomialverteilung, deren Erfolgswahrscheinlichkeit eine Funktion des Verhältnisses von zwei Lambda ist. Daher können Hypothesentests und Intervallschätzungsverfahren leicht aus den genauen Methoden entwickelt werden, um Rückschlüsse auf die Wahrscheinlichkeit des binomialen Erfolgs zu ziehen. Hierfür werden in der Regel zwei Methoden in Betracht gezogen,

  1. C-Test
  2. E-Test

Details zu diesen beiden Tests finden Sie in diesem Artikel. Ein leistungsstärkerer Test zum Vergleichen zweier Poisson-Mittelwerte


4
+1 Gute Referenz, danke. Der C-Test ist eine strengere Version des von mir skizzierten, es lohnt sich also, darüber nachzudenken. Der E-Test bezieht eine T-Statistik auf eine geeignete Verteilung. Die Berechnung dieser Verteilung erfordert eine doppelte unendliche Summe, für deren Konvergenz -Berechnungen erforderlich sind: ziemlich einfach zu codieren, wahrscheinlich übertrieben, um die Zeitung zu überprüfen! O(n1n2)
Whuber

1
Der Autor des E-Testpapier hat eine einfache Implementierung Fortran zu berechnen p-Werte für zwei poisson Mittel hier: ucs.louisiana.edu/~kxk4695 ich ihre Fortran in MATLAB hier portiert git.io/vNP86
AndyL

11

Wie wäre es mit:

poisson.test(c(n1, n2), c(t1, t2), alternative = c("two.sided"))

Dies ist ein Test, der die Poisson-Raten von 1 und 2 miteinander vergleicht und sowohl einen p-Wert als auch ein 95% -Konfidenzintervall ergibt.


Es ist zu beachten, dass für ein Problem mit zwei Stichproben ein Binomialtest verwendet wird, um die Raten zu vergleichen
Jon

10

Sie suchen einen schnellen und einfachen Check.

λt=t1+t2[0,t1]n1[t1,t1+t2]n2

λ^=n1+n2t1+t2

nichtichλ^nich


1
Danke (+1), das ist genau der richtige Scheck für eine solche Sache. Es wurde hoch signifikant (p = 0,005), so dass der Artikel in Ordnung ist. Ich hoffe, es macht Ihnen nichts aus, dass ich die andere Antwort akzeptiert habe - es ist gut zu wissen, wie man es wirklich macht, wenn es darauf ankommt.
Charles

5

Ich wäre mehr an einem Konfidenzintervall als an einem p-Wert interessiert, hier ist eine Bootstrap-Annäherung.

Berechnen Sie zuerst die Länge der Intervalle und führen Sie eine Überprüfung durch:

Lrec = as.numeric(as.Date("2010-07-01") - as.Date("2007-12-02")) # Length of recession
Lnrec = as.numeric(as.Date("2007-12-01") - as.Date("2001-12-01")) # L of non rec period
(43/Lrec)/(50/Lnrec)

[1] 2.000276

Diese Prüfung ergibt ein geringfügig anderes Ergebnis (100,03% Anstieg) als das der Veröffentlichung (101% Anstieg). Mach mit dem Bootstrap weiter (mach es zweimal):

N = 100000
k=(rpois(N, 43)/Lrec)/(rpois(N, 50)/Lnrec)
c(quantile(k, c(0.025, .25, .5, .75, .975)), mean=mean(k), sd=sd(k))

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7338545 1.9994599 2.2871373 3.0187243 2.0415132 0.4355660 

     2.5%       25%       50%       75%     97.5%      mean        sd 
1.3130094 1.7351970 2.0013578 2.3259023 3.0173868 2.0440240 0.4349706 

Das 95% -Konfidenzintervall der Erhöhung beträgt 31% bis 202%.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.