Es gibt bereits einige ausgezeichnete Antworten auf diese Frage, aber ich möchte beantworten, warum der Standardfehler so ist, wie er ist, warum wir als den schlechtesten Fall verwenden und wie der Standardfehler mit variiert .np = 0,5n
Angenommen, wir wählen nur einen Wähler aus, nennen ihn oder sie Wähler 1 und fragen: "Wirst du für die Purple Party stimmen?" Wir können die Antwort als 1 für "Ja" und 0 für "Nein" codieren. Angenommen, die Wahrscheinlichkeit eines "Ja" ist . Wir haben jetzt eine binäre Zufallsvariable die 1 mit der Wahrscheinlichkeit und 0 mit der Wahrscheinlichkeit . Wir sagen, dass eine Bernouilli-Variable mit Erfolgswahrscheinlichkeit , die wir in schreiben können . Die erwartete oder mittlereX 1 p 1 - p X 1 p X 1 ~ B e r n o u i l l i ( p ) X 1 E ( X 1 ) = Σ x P ( X 1 = x ) x X 1 1 - p p E ( X 1 ) = 0 ( 1 - ppX1p1 - pX1pX1~ B e r n o u i l l i ( p )X1E ( X1) = ∑ x P( X1= x )xX1. Es gibt jedoch nur zwei Ergebnisse, 0 mit der Wahrscheinlichkeit und 1 mit der Wahrscheinlichkeit , sodass die Summe nur . Halte inne und denke nach. Dies sieht tatsächlich völlig vernünftig aus - wenn die Wahrscheinlichkeit, dass Wähler 1 die Purple Party unterstützt, bei 30% liegt und wir die Variable auf 1 kodiert haben, wenn sie "Ja" sagen, und 0, wenn sie "Nein" sagen, dann würden wir Erwarten Sie, dass durchschnittlich 0,3 ist.1 - ppX 1E ( X1) = 0 ( 1 - p ) + 1 ( p ) = pX1
Stellen wir uns vor, was passiert, wenn wir . Wenn dann und wenn dann . Tatsächlich ist also in beiden Fällen . Da sie gleich sind, müssen sie denselben erwarteten Wert haben, also ist . Dies gibt mir eine einfache Möglichkeit, die Varianz einer Bernouilli-Variablen zu berechnen: Ich verwende und somit ist die Standardabweichung .X 1 = 0 X 2 1 = 0 X 1 = 1 X 2 1 = 1X1X1= 0X21= 0X1= 1X21= 1E ( X 2 1 ) = p V a r ( X 1 ) = E ( X 2 1 ) - E ( X 1 ) 2 = p - p 2 =X21= X1E ( X21) = pσ X 1 = √Va r ( X1) = E ( X21) - E ( X1)2= p - p2=p(1−p)σX1=p(1−p)−−−−−−−√
Natürlich möchte ich mit anderen Wählern sprechen - nennen wir sie Wähler 2, Wähler 3 bis Wähler . Lassen Sie uns annehmen , dass sie alle die gleiche Wahrscheinlichkeit haben der Unterstützung der purpurrote Partei. Jetzt haben wir Bernouilli-Variablen, , bis , mit jedem für von 1 bis . Sie haben alle den gleichen Mittelwert und die gleiche Varianz .p n X 1 X 2 X n X i ~ B e r n o u l l i ( p ) i n p p ( 1 - p )npnX1X2XnXi∼Bernoulli(p)inpp(1−p)
Ich möchte herausfinden, wie viele Personen in meiner Stichprobe "Ja" gesagt haben, und dazu kann ich einfach alle addieren . Ich schreibe . Ich kann den Mittelwert oder den erwarteten Wert von berechnen, indem ich die Regel verwende, dass wenn diese Erwartungen bestehen, und erweitern das zu . Aber ich addiere dieser Erwartungen und jede ist , so dass ich insgesamt X = ∑ n i = 1 X i XXiX=∑ni=1XiXE ( X 1 + X 2 + … + X n ) = E ( X 1 ) + E ( X 2 ) + … + E ( X n )E(X+Y)=E(X)+E(Y)E(X1+X2+…+Xn)=E(X1)+E(X2) + … +E(Xn)p E ( X ) = n p n pnpE (X) = n p. Halte inne und denke nach. Wenn ich 200 Leute befrage und jeder eine 30% ige Chance hat zu sagen, dass er die Purple Party unterstützt, würde ich natürlich erwarten, dass 0,3 x 200 = 60 Leute "Ja" sagen. Die Formel sieht also richtig aus. Weniger "offensichtlich" ist der Umgang mit der Varianz.n p
Es gibt eine Regel, die besagt,
aber ich kann sie nur verwenden, wenn meine Zufallsvariablen unabhängig voneinander sind . Also gut, lassen Sie uns diese Annahme treffen und mit einer ähnlichen Logik wie zuvor sehen, dass . Wenn eine Variable die Summe von unabhängigen Bernoulli-Versuchen mit identischer Erfolgswahrscheinlichkeit , dann sagen wir, dass eine Binomialverteilung hat, . Wir haben gerade gezeigt, dass der Mittelwert einer solchen Binomialverteilung und die Varianz .V a r ( X ) = n p ( 1 - p ) X n p X X ∼
Va r ( X1+ X2+ … + Xn) =Va r ( X1) +Va r ( X2) + … +Va r ( Xn)
Vein r (X) = n p ( 1 - p )Xn pXn p n p ( 1 - p )X∼ B i n o m i a l ( n , p )n pn p ( 1 - p )
Unser ursprüngliches Problem war, wie man aus der Stichprobe abschätzt . Der sinnvolle Weg, unseren Schätzer zu definieren, ist . Zum Beispiel sagten 64 von 200 Befragten "Ja", wir würden schätzen, dass 64/200 = 0,32 = 32% der Befragten die Purple Party unterstützen. Sie können sehen , dass ist eine „abgespeckte“ Version unserer Gesamtzahl der Ja-Wähler, . Dies bedeutet, dass es sich weiterhin um eine Zufallsvariable handelt, die jedoch nicht mehr der Binomialverteilung folgt. Wir können seinen Mittelwert und seine Varianz ermitteln, denn wenn wir eine Zufallsvariable mit einem konstanten Faktor skalieren , befolgt sie die folgenden Regeln: (also die Mittelwertskala) um den gleichen Faktor ) undp = X / n p X k E ( k X ) = k E ( X ) k V a r ( k X ) = k 2 V a r ( X ) k 2 c m 2pp^= X/ np^XkE (kX) = k E ( X)kVa r ( k X) = k2Va r ( X) . Beachten Sie, wie die Varianz um skaliert . Dies ist sinnvoll, wenn Sie wissen, dass die Varianz im Allgemeinen im Quadrat der Einheiten gemessen wird, in denen die Variable gemessen wird. Dies ist hier nicht zutreffend, aber wenn unsere Zufallsvariable eine Höhe in cm gewesen wäre, wäre die Varianz in die unterschiedlich skalieren - wenn Sie die Länge verdoppeln, vervierfachen Sie die Fläche.k2c m2
Hier ist unser Skalierungsfaktor . Dies gibt uns . Das ist toll! Im Durchschnitt ist unser Schätzer genau das, was er sein sollte, die wahre (oder Bevölkerungs-) Wahrscheinlichkeit, dass ein zufälliger Wähler sagt, dass er für die Purple Party stimmen wird. Wir sagen, dass unser Schätzer unvoreingenommen ist . Aber obwohl es im Durchschnitt korrekt ist, ist es manchmal zu klein und manchmal zu hoch. Wir können sehen, wie falsch es wahrscheinlich ist, indem wir seine Varianz betrachten. . Die Standardabweichung ist die Quadratwurzel, E( p )=11n p Var( p )=1E ( S.^) = 1nE ( X) = n pn= pp^ √Va r ( p^) = 1n2Va r ( X) = n p ( 1 - p )n2= p ( 1 - p )np ( 1 - p )n-----√und weil es uns einen Überblick darüber gibt, wie schlecht unser Schätzer abschneidet (es ist effektiv ein quadratischer Mittelwertfehler , eine Methode zur Berechnung des Durchschnittsfehlers, die positive und negative Fehler als gleich schlecht behandelt, indem sie vor dem Mitteln quadriert werden). Dies wird normalerweise als Standardfehler bezeichnet . Eine gute Faustregel, die für große Stichproben gut funktioniert und die mit dem berühmten zentralen Grenzwertsatz strenger behandelt werden kann , lautet, dass die Schätzung in den meisten Fällen (etwa 95%) um weniger als zwei Standardfehler falsch ist.
Da es im Nenner des Bruches erscheint, verringern höhere Werte von - größeren Abtastwerten - den Standardfehler. Das sind großartige Neuigkeiten, denn wenn ich einen kleinen Standardfehler haben möchte, mache ich die Stichprobengröße einfach groß genug. Die schlechte Nachricht ist, dass innerhalb einer Quadratwurzel liegt. Wenn ich also die Stichprobengröße vervierfache, halbiere ich nur den Standardfehler. Bei sehr kleinen Standardfehlern handelt es sich um sehr große und daher teure Stichproben. Es gibt noch ein anderes Problem: Wenn ich einen bestimmten Standardfehler als Ziel festlegen möchte, z. B. 1%, muss ich wissen, welcher Wert von für meine Berechnung verwendet werden soll. Ich könnte historische Werte verwenden, wenn ich frühere Abfragedaten habe, aber ich möchte mich auf den schlimmsten Fall vorbereiten. Welcher Wert vonn p pnnppist am problematischsten? Ein Diagramm ist lehrreich.
Der schlechteste (höchste) Standardfehler tritt auf, wenn . Um zu beweisen, dass ich Kalkül verwenden könnte, aber eine Algebra der High School wird den Trick tun, solange ich weiß, wie man " das Quadrat vervollständigt ". p = 0,5
p ( 1 - p )-------√= p - p2-----√= 14- ( p2- p + 14)--------------√= 14- ( p - 12)2-----------√
Der Ausdruck ist, dass die eckigen Klammern immer eine Null oder eine positive Antwort zurückgeben, die dann von einem Viertel weggenommen wird. Im schlimmsten Fall (großer Standardfehler) wird so wenig wie möglich weggenommen. Ich weiß, dass das Mindeste, das subtrahiert werden kann, Null ist, und das wird auftreten, wenn , also wenn . Das Ergebnis ist, dass ich größere Standardfehler bekomme, wenn ich versuche, die Unterstützung für z. B. Parteien in der Nähe von 50% der Stimmen zu schätzen, und niedrigere Standardfehler, wenn ich die Unterstützung für Vorschläge schätze, die wesentlich mehr oder wesentlich weniger populär sind. Tatsächlich zeigt mir die Symmetrie meines Diagramms und meiner Gleichung, dass ich für meine Schätzungen der Unterstützung der Lila Partei den gleichen Standardfehler erhalten würde, unabhängig davon, ob sie 30% Unterstützung durch die Bevölkerung oder 70% hatten.p=1p - 12= 0p = 12
Wie viele Personen muss ich abfragen, um den Standardfehler unter 1% zu halten? Dies würde bedeuten, dass meine Schätzung die meiste Zeit innerhalb von 2% des korrekten Anteils liegen wird. Ich weiß jetzt, dass der schlechteste Standardfehler , was mir und so . Das würde erklären, warum Sie Umfragezahlen in den Tausenden sehen.√0,25n---√= 0,5n√< 0,01n>2500n--√> 50n > 2500
In Wirklichkeit ist ein niedriger Standardfehler keine Garantie für eine gute Schätzung. Viele Abstimmungsprobleme sind eher praktischer als theoretischer Natur. Ich nahm zum Beispiel an, dass die Stichprobe aus zufälligen Wählern mit der gleichen Wahrscheinlichkeit , aber eine "zufällige" Stichprobe im wirklichen Leben zu nehmen ist schwierig. Sie können Telefon- oder Online-Umfragen durchführen - aber nicht nur, dass nicht jeder einen Telefon- oder Internetzugang hat, sondern auch diejenigen, die keine sehr unterschiedlichen demografischen Merkmale (und Abstimmungsabsichten) aufweisen als diejenigen, die dies tun. Um eine Verzerrung der Ergebnisse zu vermeiden, werten die Umfragegesellschaften ihre Stichproben tatsächlich nach allen möglichen Kriterien und nicht nach dem einfachen Durchschnitt∑ X ip∑ Xichndas habe ich genommen. Auch die Leute lügen Umfrageteilnehmer an! Die unterschiedlichen Möglichkeiten, mit denen die Meinungsforscher diese Möglichkeit kompensieren, sind offensichtlich umstritten. Sie können eine Vielzahl von Ansätzen darin sehen, wie Umfrageunternehmen in Großbritannien mit dem sogenannten Shy Tory Factor umgegangen sind. Eine Korrekturmethode bestand darin, zu prüfen, wie die Menschen in der Vergangenheit abgestimmt haben, um zu beurteilen, wie plausibel ihre angebliche Wahlabsicht ist. Es stellt sich jedoch heraus, dass viele Wähler sich einfach nicht an ihre Wahlgeschichte erinnern , auch wenn sie nicht lügen . Wenn Sie dieses Zeug haben, gibt es ehrlich gesagt sehr wenig Sinn, den "Standardfehler" auf 0,00001% zu senken.
Zum Schluss einige Grafiken, die zeigen, wie die erforderliche Stichprobengröße nach meiner vereinfachten Analyse durch den gewünschten Standardfehler beeinflusst wird und wie schlecht der "worst case" -Wert von im Vergleich zu den zugänglicheren Anteilen ist. Denken Sie daran , dass die Kurve für würde zu den einem identisch sein aufgrund der Symmetrie der früheren Graphen von p = 0,5p = 0,7p = 0,3p ( 1 - p )-------√