Wie geht es dem Garvan?
Das Problem ist, dass wir nicht wissen, wie viele Nullzählungen beobachtet werden. Das müssen wir abschätzen. Ein klassisches statistisches Verfahren für Situationen wie diese ist der Expectation-Maximization-Algorithmus.
Ein einfaches Beispiel:
Angenommen, wir ziehen aus einer unbekannten Population (von 1.000.000) mit einer Poisson-Konstante von 0,2.
counts <- rpois(1000000, 0.2)
table(counts)
0 1 2 3 4 5
818501 164042 16281 1111 62 3
Aber wir beobachten die Nullzählungen nicht. Stattdessen beobachten wir Folgendes:
table <- c("0"=0, table(counts)[2:6])
table
0 1 2 3 4 5
0 164042 16281 1111 62 3
Mögliche Frequenzen beobachtet
k <- c("0"=0, "1"=1, "2"=2, "3"=3, "4"=4, "5"=5)
Initialisiere den Mittelwert der Poisson-Verteilung - nimm einfach eine Schätzung (wir wissen, dass es hier 0,2 ist).
lambda <- 1
Erwartung - Poissonverteilung
P_k <- lambda^k*exp(-lambda)/factorial(k)
P_k
0 1 2 3 4 5
0.367879441 0.367879441 0.183939721 0.061313240 0.015328310 0.003065662
n0 <- sum(table[2:6])/(1 - P_k[1]) - sum(table[2:6])
n0
0
105628.2
table[1] <- 105628.2
Maximierung
lambda_MLE <- (1/sum(table))*(sum(table*k))
lambda_MLE
[1] 0.697252
lambda <- lambda_MLE
Zweite Iteration
P_k <- lambda^k*exp(-lambda)/factorial(k)
n0 <- sum(table[2:6])/(1 - P_k[1]) - sum(table[2:6])
table[1] <- n0
lambda <- (1/sum(table))*(sum(table*k))
population lambda_MLE
[1,] 361517.1 0.5537774
Nun iteriere bis zur Konvergenz:
for (i in 1:200) {
P_k <- lambda^k*exp(-lambda)/factorial(k)
n0 <- sum(table[2:6])/(1 - P_k[1]) - sum(table[2:6])
table[1] <- n0
lambda <- (1/sum(table))*(sum(table*k))
}
cbind( population = sum(table), lambda_MLE)
population lambda_MLE
[1,] 1003774 0.1994473
Unsere Bevölkerungsschätzung beträgt 1003774 und unsere Giftrate wird auf 0,1994473 geschätzt - dies ist der geschätzte Anteil der beprobten Bevölkerung. Das Hauptproblem bei den typischen biologischen Problemen ist die Annahme, dass die Giftrate eine Konstante ist.
Entschuldigung für den langwierigen Beitrag - dieses Wiki ist nicht wirklich für R-Code geeignet.