Betrachten Sie ein Experiment, das ein Verhältnis zwischen 0 und 1 ausgibt . Wie dieses Verhältnis erhalten wird, sollte in diesem Zusammenhang nicht relevant sein. Es wurde in einer früheren Version dieser Frage ausgearbeitet , aber aus Gründen der Klarheit nach einer Diskussion über Meta entfernt .
Dieses Experiment wird mal wiederholt , während klein ist (ungefähr 3-10). Es wird angenommen, dass die unabhängig und identisch verteilt sind. Aus diesen schätzen wir den Mittelwert durch Berechnung des Durchschnitts , aber wie berechnet man ein entsprechendes Konfidenzintervall ?
Bei Verwendung des Standardansatzes zur Berechnung von Konfidenzintervallen ist manchmal größer als 1. Meiner Intuition nach ist das richtige Konfidenzintervall ...
- ... sollte zwischen 0 und 1 liegen
- ... sollte mit zunehmendem n kleiner werden
- ... liegt ungefähr in der Größenordnung derjenigen, die mit dem Standardansatz berechnet wurde
- ... wird nach einer mathematisch fundierten Methode berechnet
Dies sind keine absoluten Voraussetzungen, aber ich möchte zumindest verstehen, warum meine Intuition falsch ist.
Berechnungen basieren auf vorhandenen Antworten
Im Folgenden werden die aus den vorhandenen Antworten resultierenden Konfidenzintervalle für verglichen .
Standardansatz (auch bekannt als "Schulmathematik")
,σ2=0,0204, daherbeträgtdas 99% -Konfidenzintervall[0,865,1,053]. Dies widerspricht der Intuition 1.
Zuschneiden (vorgeschlagen von @soakley in den Kommentaren)
Es ist einfach, den Standardansatz zu verwenden und dann als Ergebnis bereitzustellen . Aber dürfen wir das tun? Ich bin noch nicht davon überzeugt, dass die untere Grenze einfach konstant bleibt (-> 4.)
Logistisches Regressionsmodell (vorgeschlagen von @Rose Hartman)
Transformierte Daten: Ergebnis ist [ 0,173 , 7,87 ] , das Rücktransformieren ergibt [ 0,543 , 0,999 ] . Offensichtlich ist der 6.90 ein Ausreißer für die transformierten Daten, während der 0.99 nicht für die nicht transformierten Daten gilt, was zu einem sehr großen Konfidenzintervall führt . (-> 3.)
Binomial Proportion Confidence Intervall (vorgeschlagen von @Tim)
Der Ansatz sieht ganz gut aus, passt aber leider nicht zum Experiment. Das einfache Kombinieren der Ergebnisse und Interpretieren als ein großes wiederholtes Bernoulli-Experiment, wie von @ZahavaKor vorgeschlagen, ergibt Folgendes:
von insgesamt 5 ∗ 1000 . Einspeisung in den Adj. Wald-Rechner gibt [ 0,9511 , 0,9657 ] . Dies scheint nicht realistisch zu sein, da sich kein einziges X i innerhalb dieses Intervalls befindet! (-> 3.)
Bootstrapping (vorgeschlagen von @soakley)
Mit wir 3125 mögliche Permutationen. Nehmen Sie die 3093Mittelwert der Permutationen, wir erhalten[0,91,0,99]. Sieht nichtsoschlecht aus, obwohl ich ein größeres Intervall erwarten würde (-> 3.). Es ist jedoch pro Konstruktion niemals größer als[min(Xi),max(Xi)]. Für eine kleine Stichprobe wird sie daher eher wachsen als schrumpfen, umn(-> 2)zu erhöhen. Dies ist zumindest der Fall bei den oben angegebenen Beispielen.