Standardfehler für den Mittelwert einer Stichprobe binomialer Zufallsvariablen


43

Angenommen, ich führe ein Experiment durch, das zwei Ergebnisse haben kann, und ich gehe davon aus, dass die zugrunde liegende "wahre" Verteilung der beiden Ergebnisse eine Binomialverteilung mit den Parametern und : .p B i n o m i a l ( n , p )npBinomial(n,p)

Ich kann den Standardfehler aus der Varianz von berechnen : wobei . Also . Für den Standardfehler ich: , aber ich habe irgendwo gesehen, dass . Was habe ich falsch gemacht? Binomial(n,p)σ2X=npqq=1-pσX=SEX=σXnBinomial(n,p)

σX2=npq
q=1p SEX=σX=npq SEX=SEX=pqSEX=pqn

Dieser Artikel ist sehr hilfreich , um die Standardabweichung des Mittelwerts zu verstehen influentialpoints.com/Training/...
Sanghyun Lee

Meines Erachtens scheint das eng verwandte Thema, Konfidenzintervalle für eine Binomialverteilung zu erhalten, ziemlich nuanciert und kompliziert zu sein. Insbesondere sieht es so aus, als ob Konfidenzintervalle, die aus dieser Formel erhalten wurden, "Wald-Intervalle" (siehe en.wikipedia.org/wiki/Binomial_proportion_confidence_interval ), sich eher schlecht benehmen und vermieden werden sollten. Weitere Informationen finden Sie unter jstor.org/stable/2676784?seq=1#metadata_info_tab_contents .
Wasserschildkröte

Antworten:


58

Anscheinend verwenden Sie zweimal auf zwei verschiedene Arten - sowohl als Stichprobengröße als auch als Anzahl der Bernoulli-Versuche, aus denen die Zufallsvariable Binomial besteht. um alle zweideutigkeiten zu beseitigen, werde ich , um auf letzteres Bezug zu nehmen.knk

Wenn Sie unabhängige Stichproben aus einer -Verteilung haben, beträgt die Varianz ihres StichprobenmittelwertsB i n o m i a l ( k , p )nBinomial(k,p)

var(1ni=1nXi)=1n2i=1nvar(Xi)=nvar(Xi)n2=var(Xi)n=kpqn

Dabei ist und der gleiche Mittelwert. Dies folgt seitq=1pX¯

(1) , für jeden Zufallsvariable, und beliebigen Konstante .var(cX)=c2var(X)Xc

(2) Die Varianz einer Summe unabhängiger Zufallsvariablen entspricht der Summe der Varianzen .

Der Standardfehler von ist die Quadratwurzel der Varianz: . Deshalb,X¯kpqn

  • Wenn , erhalten Sie die Formel, auf die Sie hingewiesen haben:k=npq

  • Wenn und die Binomialvariablen nur Bernoulli-Versuche sind , erhalten Sie die Formel, die Sie an anderer Stelle gesehen haben:k=1pqn


3
Wenn eine Bernoulli- Zufallsvariable ist, ist . Wenn eine binomiale Zufallsvariable hat, die auf Versuchen mit Erfolgswahrscheinlichkeit basiert , dann istXvar(X)=pqXnpvar(X)=npq
Makro

2
Vielen Dank! Du hast meine Verwirrung aufgehoben. Entschuldigung, dass es so einfach war, ich lerne noch :-)
Frank

6
Ist Frank also klar, dass wir die Tatsache verwenden, dass für jede Konstante c Var (cX) = c Var (x) gilt? Da die Stichprobenschätzung des Anteils X / n ist, haben wir Var (X / n) = Var (X) / n = npq / n = pq / n und SEx ist die Quadratwurzel davon. Ich denke, es ist für alle klarer, wenn wir alle Schritte formulieren. 222
Michael Chernick

1
@ MichaelChernick, ich habe die von Ihnen erwähnten Details geklärt. Anhand der Problembeschreibung stellte ich fest, dass Frank diese Fakten kannte, aber Sie haben Recht, dass es für zukünftige Leser lehrreicher wäre, die Details zu berücksichtigen.
Makro

2
Sol Lago - In diesem Fall ist k = 1. Wenn Sie eine Münze 50 Mal geworfen und die Anzahl der Erfolge berechnet und das Experiment 50 Mal wiederholt haben, ist k = n = 50. Ein Münzwurf ergibt eine 1 oder 0. Es ist ein Bernoulli rv
B_Miner

9

Es ist leicht, zwei Binomialverteilungen zu verwechseln:

  • Verteilung der Anzahl der Erfolge
  • Verteilung des Erfolgsanteils

npq ist die Anzahl der Erfolge, während npq / n = pq das Verhältnis der Erfolge ist. Dies führt zu unterschiedlichen Standardfehlerformeln.


6

Wir können dies folgendermaßen betrachten:

Angenommen, wir machen ein Experiment, bei dem wir mal eine unvoreingenommene Münze werfen müssen . Das Gesamtergebnis des Experiments ist was die Summe der einzelnen Würfe ist (z. B. Kopf als 1 und Schwanz als 0). Für dieses Experiment ist also , wobei Ergebnisse einzelner Würfe sind.Y Y = n i = 1 X i X inYY=i=1nXiXi

Hier folgt das Ergebnis jedes Wurfs einer Bernoulli-Verteilung und das Gesamtergebnis einer Binomialverteilung. YXiY

Das gesamte Experiment kann als einzelne Probe betrachtet werden. Wenn wir also das Experiment wiederholen, können wir einen anderen Wert von , der eine andere Stichprobe bildet. Alle möglichen Werte von bilden die gesamte Grundgesamtheit.YYY

Zurück zu dem einzelnen Münzwurf, der einer Bernoulli-Verteilung folgt, ist die Varianz durch , wobei die Wahrscheinlichkeit des Kopfes (Erfolg) und .p q = 1 - ppqpq=1p

Betrachten wir nun die Varianz von , so ist . Für alle einzelnen Bernoulli-Experimente gilt jedoch . Da das Experiment Würfe oder Bernoulli-Versuche enthält, ist . Dies impliziert, dass die Varianz .YV(Y)=V(Xi)=V(Xi)V(Xi)=pqnV(Y)=V(Xi)=npqYnpq

Nun ist der Stichprobenanteil gegeben durch , was den 'Anteil von Erfolg oder Köpfen' ergibt. Hier ist eine Konstante, da wir vorhaben, für alle Experimente in der Population dieselbe Anzahl von Münzwürfen zu verwenden.p^=Ynn

Also ist .V(Yn)=(1n2)V(Y)=(1n2)(npq)=pq/n

Der Standardfehler für (eine Beispielstatistik) ist alsop^pq/n


Sie können den Latex-Schriftsatz verwenden, indem Sie Dollar um Ihre Rechnung setzen, z . B. $x$ergibt . x
Silverfish

Beachten Sie, dass der Schritt wirklich eine Rechtfertigung verdient! V(Xi)=V(Xi)
Silverfish

Der letzte Abzug enthält Tippfehler. V (Y / n) = (1 / n ^ 2) * V (Y) = (1 / n ^ 2) * npq = pq / n sollte der richtige Abzug sein.
Tarashankar

Entschuldigung, das habe ich beim Setzen eingeführt. Hoffentlich jetzt sortiert.
Silverfish

1
Das ist wahr, wenn die sind - um dies zu rechtfertigen, verwenden wir die Tatsache, dass die Versuche als unabhängig angenommen werden. Xi
Silverfish

2

Ich denke, es gibt auch eine gewisse Verwechslung im ersten Beitrag zwischen Standardfehler und Standardabweichung. Die Standardabweichung ist der Quadratmeter der Varianz einer Verteilung. Standardfehler ist die Standardabweichung des geschätzten Mittelwerts einer Stichprobe von dieser Verteilung, dh die Streuung der Mittelwerte, die Sie beobachten würden, wenn Sie diese Stichprobe unendlich oft durchführen würden. Ersteres ist eine inhärente Eigenschaft der Distribution; Letzteres ist ein Maß für die Qualität Ihrer Schätzung einer Eigenschaft (des Mittelwerts) der Verteilung. Wenn Sie ein Experiment mit N Bernouilli-Versuchen durchführen, um die unbekannte Erfolgswahrscheinlichkeit abzuschätzen, ist die Unsicherheit Ihres geschätzten p = k / N, nachdem Sie k Erfolge gesehen haben, ein Standardfehler des geschätzten Anteils sqrt (pq / N) mit q = 1 -p. Die wahre Verteilung wird durch einen Parameter P charakterisiert, die wahre Erfolgswahrscheinlichkeit.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.