Ich habe fast die gleichen Fragen wie diese: Wie kann ich die Summe der Bernoulli-Zufallsvariablen effizient modellieren?
Aber die Einstellung ist ganz anders:
, , ~ 20, ~ 0,1
Wir haben die Daten für die Ergebnisse von Bernoulli-Zufallsvariablen: ,
Wenn wir mit maximaler Wahrscheinlichkeitsschätzung schätzen (und ), stellt sich heraus, dass dann viel größer ist erwartet durch die anderen Kriterien:pP { S = 3 } ( p M L E i ) P { S = 3 } ( p M L E i ) - P e x p e c t e d { S = 3 } ≤ 0,05
Also, und kann nicht als unabhängig behandelt werden (sie haben eine geringe Abhängigkeit).
Es gibt einige Einschränkungen wie diese: und (bekannt), die bei der Schätzung von helfen sollten .
Wie könnten wir in diesem Fall versuchen, die Summe der Bernoulli-Zufallsvariablen zu modellieren?
Welche Literatur könnte nützlich sein, um die Aufgabe zu lösen?
AKTUALISIERT
Es gibt einige weitere Ideen:
(1) Es ist anzunehmen, dass die unbekannte Abhängigkeit zwischen nach einem oder mehreren Erfolgen in Serie beginnt. Wenn also , und . ∑ i = 1 , K X i >0 p K + 1 → p ' K + 1 p ' K + 1 < p K + 1
(2) Um MLE verwenden zu können, benötigen wir das am wenigsten fragwürdige Modell. Hier ist eine Variante:
∑ i = 1 , k X i = 0 P { X 1 , . . . , X k , X k + 1 , . . . , X N. wenn für jedes k if und und für jedes k.∑ i = 1 , k - 1 X i = 0 X k = 1 P ' { X k + 1 = 1 , X k + 2 = 1 ,
(3) Da wir nur an interessiert sind, können wir (die Wahrscheinlichkeit von Erfolgen für N- (k + 1) + 1 Summanden vom Schwanz). Und benutze die ParametrisierungP ' { X k + 1 , . . . , X N } ≤ P ' ' { ≤ i = 1 , k X i = s ' ; N - ( ∑ i = k + 1 , N X i P " { ∑ i = k , N X i = s
(4) Verwenden Sie MLE für ein Modell, das auf den Parametern und basiert mit für (und ein beliebiges ) und einige andere native Einschränkungen .p 0 , 1 , p 1 , 1 ; p 0 , 2 , p 1 , 2 , p 2 , 2 ; . . . p s ' , l = 0 s ' ≥ 6 l
Ist mit diesem Plan alles in Ordnung?
AKTUALISIERT 2
Einige Beispiele für die empirische Verteilung (rot) im Vergleich zur Poisson-Verteilung (blau) (die Poisson-Mittelwerte sind 2,22 und 2,45, die Stichprobengrößen sind 332 und 259):
Für Proben (A1, A2) mit dem Poisson bedeutet 2,28 und 2,51 (Probengrößen sind 303 und 249):
Für verbundene Proben A1 + A2 (die Stichprobengröße beträgt 552):
Es sieht so aus, als ob eine Korrektur von Poisson das beste Modell sein sollte :).