Es gibt mehrere Probleme mit Ihrem Ansatz. Zunächst möchten Sie Konfidenzintervalle für etwas verwenden, für das sie nicht entwickelt wurden. Wenn variiert, zeigt das Konfidenzintervall nicht , wie es variiert. Überprüfen Sie, warum ein 95% -Konfidenzintervall (CI) keine 95% ige Chance bedeutet, den Mittelwert zu enthalten. um mehr über Konfidenzintervalle zu erfahren. Darüber hinaus ist die Verwendung einer normalen Näherung für das Binomialverhältnis und seine Konfidenzintervalle keine gute Idee, wie von Brown et al. (2001) beschrieben .p
Aus Ihrer Beschreibung geht hervor, dass Sie das glaubwürdige Bayes'sche Intervall schätzen möchten , dh das Intervall, das einen bestimmten Bruchteil der Verteilung von . Ja, ich sagte Bayesian , da in der Tat Sie bereits Ihr Problem als Bayes - Modell definiert. Sie sagen, dass Sie annehmen, dass eine Zufallsvariable ist, während in der Frequentist-Einstellung ein fester Parameter wäre. Wenn Sie es bereits angenommen haben, warum nicht ein Bayes'sches Modell für Ihre Daten verwenden? Sie würden das Beta-Binomial-Modell verwenden (siehe auch Eine Einführung in das Beta-Binomial-ModellpppPapier von Dan Navarro und Amy Perfors). In solchen Fällen ist es äußerst einfach, ein solches Modell abzuschätzen. Wir können es wie folgt definieren:
X∼Binomial(N,p)p∼Beta(α,β)
Ihre Daten folgen also der durch und parametrisierten Binomialverteilung , wobei eine Zufallsvariable ist. Wir gehen von einer Beta-Verteilung mit den Parametern und als Prior für . Ich denke , dass , wenn Sie frequentistischen Methode verwenden wollen, Sie keine haben , bevor das Wissen über mögliche Verteilung von , so würden Sie wählen „uninformativ“ vor parametrisiert durch , oder (Wenn Sie möchten, können Sie diese Parameter in übersetzenXNppαβppα=β=1α=β=0.5Mittelwert und Präzision oder Mittelwert und Varianz ). Nach der Aktualisierung Ihrer vorherigen ist die posteriore Verteilung von einfach eine Beta-Verteilung, die von parametrisiert wirdp
α′=α+total number of successesβ′=β+total number of failures
mit gemein
E(X)=Nα′α′+β′
Weitere Informationen zur Berechnung anderer Mengen dieser Verteilung finden Sie im Wikipedia-Artikel zur Beta-Binomial-Verteilung . Sie können glaubwürdige Intervalle numerisch berechnen, indem Sie entweder (a) die kumulative Verteilungsfunktion der Beta-Binomialverteilung numerisch invertieren oder (b) eine große Anzahl von Zufallswerten aus der Beta-Binomialverteilung abtasten und dann Stichprobenquantile daraus berechnen . Der zweite Ansatz ist ziemlich einfach, da Sie nur den folgenden Vorgang nacheinander wiederholen müssen:
- Zeichnen Sie aus der Beta-Verteilung, die durch und parametrisiert ist.pα′β′
- Zeichnen Sie aus der durch und parametrisierten Binomialverteilung .xpN
bis Sie eine Probe ziehen, die groß genug ist, um sie für die Berechnung der interessierenden Mengen sicher zu finden.
Wenn Sie den Mittelwert und die Standardabweichung von und darauf bestehen, die Normalverteilung dafür zu verwenden, können Sie natürlich auch die Simulation verwenden, aber die Normalverteilung zur Simulation der Werte von . Unten gebe ich ein Codebeispiel in R für eine solche Simulation.pp
R <- 1e5 # number of samples to draw in simulation
N <- 500 # known N
mu <- 0.3 # known mean of p
sigma <- 0.07 # known standard deviation of p
p <- rnorm(R, mu, sigma) # simulate p
x <- rbinom(R, N, p) # simulate X
mean(x) # estimate for mean of X
quantile(p*N, c(0.025, 0.975)) # 95% interval estimate for variability of E(X)
Oder Sie können einfach geeignete quantiles nehmen mit Inverse der normalen Verteilungsfunktion und multiplizieren Sie sie mit . Denken Sie jedoch daran, dass dies kein Konfidenzintervall ist, sondern ein glaubwürdiges Intervall.N
Brown, LD, Cai, TT & DasGupta, A. (2001). Intervallschätzung für einen Binomialanteil. Statistical Science, 101-117.