Brexit: War "Urlaub" statistisch signifikant? [geschlossen]


12

In diesem Beitrag stellen wir eine Frage zu einem Naturphänomen namens Menschen, das versucht, durch Stimmenzählung eine Entscheidung zu treffen . Das spezifische Ereignis eines solchen natürlichen Phänomens, um das es in dieser Frage geht, ist der Fall des Brexit .

Hinweis: Die Frage betrifft nicht die Politik. Ziel ist es, ein solches natürliches Phänomen unter statistischen Gesichtspunkten anhand von Beobachtungen zu diskutieren.

Die spezifische Frage ist:

  • Frage: Was bedeutet die 51.9% Brexit Stimme verlassen bedeuten? Bedeutet das beispielsweise, dass die Öffentlichkeit die EU wirklich verlassen möchte? Bedeutet dies einfach, dass die Öffentlichkeit unsicher ist und mehr Zeit zum Nachdenken benötigt? Oder ist es etwas anderes?

Annahme 1: Es liegt kein Fehler im Abstimmungsprozess vor.


14
Bei Demokratie geht es nicht um statistische Signifikanz. Das Ergebnis von 51,9% bedeutet, dass 51,9% derjenigen, die gewählt haben, "Urlaub" gewählt haben. Dies ist keine Meinungsumfrage. Diejenigen, die nicht gewählt haben, haben mit ihren Füßen gewählt (nicht). Die Interpretation von 51,9% als "Öffentlichkeit ist unsicher und braucht mehr Zeit zum Nachdenken" liegt einfach in der Statistik. Der Brexit erfolgte mit Wahrscheinlichkeit 1.
Tim

7
Dieser Thread ist dazu bestimmt, nicht statistisch, mit einer Meinung versehen und möglicherweise sogar polemisch zu sein. Es passt einfach nicht zu dieser Site, egal wie beliebt sie ist. Wir haben einen Chatroom mit Leuten, die gerne weitere Gespräche führen würden: check it out!
Whuber

2
Ich bin der Meinung, dass die aktuelle Diskussion statistisch ausgerichtet ist und ein gutes Beispiel für die Interpretation der Abstimmungsergebnisse im Hinblick auf statistische Tests darstellt.
Underminer

3
Sie sprechen ein wichtiges Thema an: Messfehler von Meinungskennzahlen wie Umfragen. Ich befürchte, dass die Hauptfehlerquelle nicht die Stichprobengröße ist.
Aksakal

4
IMHO, dies ist eine nicht statistische Frage, bei der ein dünnes Furnier an Statistiken hinzugefügt wurde, um diese Tatsache zu verschleiern. Wie ich es gelesen habe, beseitigt die Annahme "es gibt keinen Fehler im Abstimmungsprozess" alle statistischen Überlegungen und kanalisiert die Diskussion notwendigerweise in das, was "Abstimmen ... bedeutet" in einer Demokratie. Das ist eine Frage der Politikwissenschaft und Philosophie, nicht der Statistik.
whuber

Antworten:


17

Ich stimme @Underminer zu, dass es keinen Stichprobenfehler gibt, aber nicht, weil die Stichprobe groß ist, sondern weil es keine Stichproben gab . Niemand wurde zur Abstimmung befragt. Es gab offensichtlich einen vernachlässigbaren Teil der Leute, die wählen wollten, aber nicht konnten (z. B. an diesem Tag einen Autounfall hatten) oder die ungültige Stimmen abgegeben haben, aber das ist die einzige "Stichprobe" hier.

Das Ergebnis ist genau, es liegt kein Fehler vor, da die gesamte Bevölkerung an der Abstimmung teilgenommen hat (einige haben daran teilgenommen, indem sie nicht teilgenommen haben). Einige Leute beschlossen zu wählen, andere nicht. Einige beschlossen , über Urlaub abzustimmen, andere nicht. Bei Demokratie geht es nicht um statistische Signifikanz, sondern darum, was wirklich passiert ist . Abstimmungen sind nicht dazu gedacht, die Meinung der Menschen zu erfahren, sondern eine Entscheidung zu treffen. Tatsächlich stimmen Menschen manchmal nicht danach ab, was sie denken, sondern um etwas zu manifestieren oder zu erreichen . Zum Beispiel können Menschen bei Wahlen nicht zu ihrem bevorzugten Kandidaten, sondern zu ihrem zweiten bevorzugten Kandidaten wählen, wenn sie der Meinung sind, dass er größere Gewinnchancen hat.


Betrachten Sie den Fall einer Grauzone, in der die Wahlbevölkerung nicht genau weiß, was für sie gut ist. Zum Beispiel bei 2 Kandidaten, die fast gleich gut sind. In einem solchen Fall werden sich meiner Meinung nach diejenigen, die wählen, wahrscheinlich unsystematisch unterscheiden, da ihre Stimmen meiner Meinung nach eine Verteilung aufweisen könnten, die einer einheitlichen nahe kommt. Mein Ziel ist es hier nicht, Demokratie neu zu definieren (ein politisches Thema), sondern zu sehen, was wir darüber sagen können, ob der Brexit eine Grauzone war?
Höhlenmensch

2
@caveman egal ob sie sich sicher sind oder nicht, was zählt ist, wie sie abgestimmt haben, da es bei der Abstimmung um tatsächliche Stimmen geht. Sicherlich hatten einige Leute keine klare Meinung, einige stimmten und andere nicht, aber das ist auch egal, denn es zählen die tatsächlichen Stimmen derjenigen, die gestimmt haben.
Tim

Wenn ich es richtig verstehe, geht es Ihnen darum, wie Demokratie Stimmen interpretiert? Ich stimme mit Ihnen ein. Ich interpretiere es jedoch nicht so, wie es Politiker tun. Ich versuche anhand der Bevölkerung herauszufinden, ob eine Entscheidung gut, schlecht oder nicht sehr klar ist. Dies ist eine andere Verwendung der Abstimmung.
Höhlenmensch

2
Die Leute von @caveman haben im Laufe der Zeit ihre Meinung geändert, Psychologen haben Tausende von Artikeln darüber geschrieben ... Ja, 51,9% bedeuten nicht, dass genau 51,9% der Briten zu 100% sicher sind, die EU zu verlassen. Die Leute können sogar unsicher sein, ob sie die Länge der Zeilen vergleichen wollen ( en.wikipedia.org/wiki/Asch_conformity_experiments ) ...
Tim

1
@Aksakal Ich werde nicht kommentieren, wer wahlberechtigt ist und wer nicht. Ich werde auch nicht darauf eingehen, wie schwierig es sein könnte, die erforderlichen Zeugnisse zu erhalten. Das ist Politik und als solche hier nicht zum Thema. Aus statistischer Sicht hat jeder Wahlberechtigte eine gewisse Wahrscheinlichkeit, nicht zu wählen. Diese Wahrscheinlichkeit kann durch bestimmte Faktoren beeinflusst werden, die mit ihren Präferenzen zusammenhängen oder nicht, aber jeder berechtigte Wähler entscheidet sich (nicht), dieses Recht nach eigenem Ermessen auszuüben.
user3697176

9

51,9% ist der Anteil der Wähler , die zu wollen verlassen . Da die Stichprobengröße so groß ist (> 33 Millionen), gibt es praktisch keinen Zufallsstichprobenfehler.

Bei statistischen Signifikanztests würde versucht, festzustellen, ob der Unterschied zwischen Verbleib und Urlaub allein durch einen zufälligen Stichprobenfehler erklärt werden kann, und der Unterschied wäre sicherlich signifikant (siehe @ cavemans Antwort).

Das Problem bei diesem Ansatz ist, dass die statistische Signifikanz stark davon ausgeht, dass die Stichprobe für die gesamte Bevölkerung (ganz Großbritannien) repräsentativ ist, nicht nur für diejenigen, die wählen.

Die Nichtantwortrate (diejenigen, die nicht wählen) ist enorm wichtig, um zu bestimmen, ob mehr als die Hälfte von Großbritannien "abreisen" will, und ist schwer zu messen. Ein Non-Response-Bias entsteht, wenn Untergruppen, die mit geringerer Wahrscheinlichkeit abstimmen, systematisch unterschiedliche Ansichten haben. Zum Beispiel stimmten Millennials laut Exit-Umfragen weniger, dafür aber eher weiterhin , ab, was die Ergebnisse verzerrt, wenn versucht wird, die Bevölkerung in ganz Großbritannien darzustellen.

Aus diesem Grund sind statistische Signifikanztests im herkömmlichen Sinne weitgehend ungeeignet .


Annahmen: Wir müssen einige Begriffe definieren, damit dies sinnvoll ist und keine politische Diskussion darüber stattfindet, was mit der Abstimmung erreicht werden soll. Hier sind meine Definitionen:

Bevölkerung: Jede Person, die in Großbritannien lebt

Stichprobenrahmen: Jede stimmberechtigte Person, die zur Stimmabgabe berechtigt ist

Stichprobenverfahren: Freiwillige Antwort, der Akt der Stimmabgabe nimmt an der Umfrage teil

Beispiel: Die Personen, die tatsächlich abstimmen

In dieser Konfiguration könnte der Stichprobenanteil (zum Guten oder Schlechten) verwendet werden, um den Prozentsatz aller Personen zu schätzen, die dazu neigen, zu bleiben (oder zu gehen ).


8

Du fragst

Was bedeutet das Brexit-Votum von 51,9%?

Dies bedeutet, dass 51,9% der Wähler für den Austritt gestimmt haben.

Bedeutet das beispielsweise, dass die Öffentlichkeit die EU wirklich verlassen möchte? Bedeutet dies einfach, dass die Öffentlichkeit unsicher ist und mehr Zeit zum Nachdenken benötigt? Oder ist es etwas anderes?

Die Stimmen umfassten "Leave" -Stimmen und 1617421887 "verbleibende" Stimmen geben 12 an16146297 Wahlberechtigte haben nicht gewählt und rund 18 Millionen Einwohner sind keine Wahlberechtigten. Da weder die Sammlung der tatsächlichen Wähler noch die Sammlung der wahlberechtigten Wähler "öffentlich" ist und weder eine repräsentative (zufällige, unbefangene, ein relevantes Adjektiv auswählende) Stichprobe von "der Öffentlichkeit" ist, ist die 51,9% ige Brexit-Abstimmung für Ihre Sekunde nicht aussagekräftig und nachfolgende Fragen.1293135318

Es könnte möglich gewesen sein, einen Fragebogen zu erstellen, der auf Ihre Fragen reagiert. Dies scheint nicht das gewesen zu sein, was im Referendum als umgesetzt geschah.


1
Könnten Sie bitte die Bedeutung der Stimmen in Bezug auf die Wähler (dh nicht die gesamte Bevölkerung) erörtern, abgesehen von der Schlussfolgerung, dass dies " 51,9% der abgegebenen Stimmen " bedeutet? Ich frage mich, wie viele Informationen wir daraus gewinnen können.
Höhlenmensch

4
Caveman, dieser Kommentar zeigt mehr als jeder andere, dass Ihre Frage nicht statistisch ist. Da 51,9% (zusammen mit den Gesamtzahlen) alle nachgewiesenen Daten zu den Wählern darstellen und es keine Unsicherheit gibt (es sei denn, Sie möchten die Genauigkeit der Zählung in Frage stellen, was ein separates Problem darstellt), impliziert Ihre Ablehnung dieser Antwort Sie suchen nach nicht statistischen Schlussfolgerungen.
Whuber

Was ist, wenn wir den Brexit als ein binäres Klassifizierungsproblem modellieren und die Wähler als Schätzungen von Klassifizierern betrachten, die Mitglied eines Ensembles sind? In diesem Modell ist es nicht das Ziel zu identifizieren, was die Mehrheit der Bürger wünscht, sondern es ist das Ziel, den optimalen Klassifikator aus dem Raum der Klassifikatoren zu identifizieren. Wir können dann einige Maßnahmen anwenden, um die Güte eines solchen auf menschlichen Wählern basierenden Klassifikatorensembles zu testen. ZB können wir Ratlosigkeit oder etwas anderes verwenden, das für diese Binärklassifizierungsaufgabe geeignet ist, bei der die Grundwahrheit unbekannt ist (z. B. wissen wir eindeutig nicht, ob Urlaub besser ist als zu bleiben).
Höhlenmensch

@caveman: Angesichts der Tatsache, dass die Grundwahrheit (korrekt) unbekannt ist, welche Metrik würden Sie verwenden, um "den optimalen Klassifikator aus dem Raum der Klassifikatoren zu identifizieren"? Jede solche Metrik kodiert die Vorurteile des Analytikers, der die Metrik auswählt, mit Ausnahme der Metrik "Reproduziert das Abstimmungsergebnis", für die Sie bereits die Antwort kennen: 51,9% / 48,1%.
Eric Towers

@EricTowers Ich habe das zu politics.stackexchange.com gebracht, wo ich über verschiedene Methoden gesprochen habe - politics.stackexchange.com/questions/11433/…
caveman

2

TL; DR

Ich habe eine unsichere Grundgesamtheit unten (unter Details ) für mal simuliert und dann die Wahrscheinlichkeit gemessen, eine Urlaubsabstimmung von ≥ zu beobachtenR=1000 unter einer solchenunsicherensimulierten Bevölkerung zu beobachten. Das gab mir die simulierte Wahrscheinlichkeitdass eine unsichere Bevölkerung eine erreichen kannUrlaubAbstimmungdie ist 51,9 % oder mehr.51.9%51.9%

Diese simulierte Wahrscheinlichkeit verläßt unter der unsicheren Bevölkerung ist .0

Vielleicht überflüssig, aber ich habe das auch gemacht, aber mit geblieben , um die Wahrscheinlichkeit zu messen, dass eine derart unsichere Bevölkerung Stimmen erhalten bleibt .48.1%

Diese simulierte Wahrscheinlichkeit , unter der unsicheren Grundgesamtheit zu bleiben , beträgt ebenfalls .0

Daher komme ich zu dem Schluss, dass das Brexit-Votum keine laute Nebenwirkung einer unsicheren oder verwirrten Bevölkerung ist. Es scheint einen systematischen Grund dafür zu geben, dass sie die EU verlassen.

Ich habe den Simulator-Code hier hochgeladen: https://github.com/Al-Caveman/Brexit

Einzelheiten

Bei Annahme 1 lauten die möglichen Antworten (oder Hypothesen):

  • H0 : Die Öffentlichkeit ist unsicher .
  • H1 : Die Öffentlichkeit will zuversichtlich gehen .

Hinweis: Dass es unmöglich ist, dass die Öffentlichkeit zuversichtlich bleiben will weil wir Abstimmungsfehler ausgeschlossen haben.

Zur Beantwortung dieser Frage (dh ob H0 oder H1 ), versuche ich zu messen:

  • Die Wahrscheinlichkeit, dass eine unsichere Bevölkerung 51,9 erreichen kannlässt nach51.9% Stimme.
  • Oder Wahrscheinlichkeit, dass eine unsichere Population bleibt dieStimme.151.9%

Ist diese Wahrscheinlichkeit gering genug ist , können wir schließen , dass die Öffentlichkeit sicher zu wollen verlassen (dh ). Wenn diese Wahrscheinlichkeit jedoch groß genug ist, können wir den Schluss ziehen, dass die Öffentlichkeit bei der Entscheidung über den Brexit (dh H 0 ) unsicher ist .H1H0

Um diese Wahrscheinlichkeit zu messen, müssen wir die Verteilung einer unsicheren britischen Bevölkerung in einem solchen binären Abstimmungssystem wie dem Brexit kennen. Daher besteht mein erster Schritt darin, diese Verteilung zu simulieren , indem ich der folgenden Annahme folge:

  • Annahme 2: Eine Bevölkerung, die sich aus unsicheren Personen zusammensetzt, hat eine zufällige Zufallsabstimmung . Dh jede mögliche Antwort hat die gleiche Chance, ausgewählt zu werden.

Aus meiner Sicht ist diese Annahme fair / vernünftig.

Zusätzlich modellieren wir die Urlaub und bleiben Kampagnen als zwei unterschiedliche Prozesse wie folgt:

  • Prozess mit der Ausgabe O leave = [ l 1 , l 2 , , l nPleaveOleave=[l1,l2,,ln] .
  • Der Prozess mit dem Ausgang O bleiben = [ r 1 , r 2 , , r n ] .PremainOremain=[r1,r2,,rn]

wo:

  • ist die Gesamtbevölkerung des Vereinigten Königreichs (einschließlich Nichtwähler).n
  • Für jedes , l i , r i{ 0 , 1 } . Ein Ausgabewert von 0 bedeutet, dass ein Wähler für den Subjektprozess mit Nein gestimmt hat , und 1i{1,2,,n}li,ri{0,1}01 Wertigkeiten , dass ein Wähler gestimmt hat ja für den gleichen Prozess.

unterliegt der folgenden Einschränkung:

  • Für jedes können l i und r i nicht gleichzeitig 1 sein. Dh l i = 1 impliziert notwendigerweise , dass r i = 0 , und r i = 1 impliziert notwendigerweise , dass die l i = 0 . Dies ist aufgrund der Tatsache , dass ein Wähler i in der Bevölkerung { 1 , 2 , ,i{1,2,,n}liri1li=1ri=0ri=1li=0i kann nicht fürUrlaubundVerbleibstimmen{1,2,,n} .

Wenn beispielsweise , es , dass aus einer Bevölkerung von Mitteln 3 hat man gewählt ja zu verlassen und zwei haben ihre Stimme abgegeben keine zuOleave=[1,0,0]3 verlassen .

Ebenso, wenn , bedeutet dies , dass aus einer Bevölkerung von 3 hat ein gestimmt ja zu bleiben und zwei haben ihre Stimme abgegeben keine zuOremain=[0,1,0]3 bleiben .

Oleave[3]=Oremain[3]=0 ).

33,568,18451.9%10051.9=48.1%

  • n=33,568,184
  • 33,568,184×0.519=17,421,887.496
    i=133,568,184Oleave[i]=17,421,887.49617,421,887
  • 33,568,184×(10.519)=16,146,296.504
    i=133,568,184Oremain[i]=16,146,296.50416,146,297

Daher definieren wir die Ausgabearrays wie folgt:

  • i{1,2,,17421887}Oleave[i]=1
  • i{17421887+1,17421887+2,,33568184}Oleave[i]=0
  • i{1,2,,17421887}Oremain[i]=0 .
  • i{17421887+1,17421887+2,,33568184}Oremain[i]=1 .
  • i{1,2,,33568184}Ounsure,m[i]=CC{0,1}mOunsure,mOunsure,mOunsure,1=Ounsure,20.533,568,184

pleave

pleave=1Rm=1R{1if (i=133,568,184Oleave[i])(i=133,568,184Ounsure,m[i])0else
ROunsure,m ist definiert.

premain value of the remain process as follows:

premain=1Rm=1R{1if (i=133,568,184Oremain[i])(i=133,568,184Ounsure,m[i])0else

To answer that, I simulated the above in C using R=1,000 and the output is:

total leave votes: 17421887
total remain votes: 16146297
simulating p values............ ok
p value for leave: 0.000000
p value for remain: 0.000000

In other words:

  • pleave=0.
  • premain=0.

2
Perhaps more important in this case is the non-response rate (i.e. individuals who do no vote). The margin of error (or measure of statistical significance) only takes into account random sample error. Non-response bias is NOT included in this, and it is much more impactful than random sampling error with a poll with such a large sample size.
Underminer

Here it says that UK has 46,499,537 eligible voters. Meaning 46,499,537(17421887+16146297)=12,931,353 didn't vote. Any idea how to interpret such unvoting population? Source: en.wikipedia.org/wiki/…
caveman

3
There is no statistically satisfactory way to deal with non-random missing data.
Underminer

Those who haven't voted, could be composed of individuals that don't care about politics (e.g. no more trust). Alternatively, it such unvoters could be those who were not sure. Or, it could be a mixture of the two. What would happen if we assume that "all unvoters are unsure"? Would this be an upper bound for testing whether the current situation was one where the public was feeling that Brexit was a grey area?
caveman

3
There is a confusion here about the nature & scope of statistics. You are attempting to create a process model of voting, & how that can inform the mechanisms & validity of governance & public decision making. This is a worthwhile task in Political Science. It is simply not statistics (although statistics is involved).
gung - Reinstate Monica

1

You could ask a slightly different question: Assuming that 50% of a very large population voted "Yes", and you asked a random sample of size S, what is the probability that 51.9% of your sample responded "Yes", depending on the sample size?

The expected value of number of "Yes" votes is 0.5 S. The variance is 0.25 S. The standard definition is 0.5 S1/2. A deviation of the actual from the expected number of "Yes" votes more than 6.1 standard deviations has a chance of one in a billion.

We have this when 0.019 S (difference between 50% and 51.9%) is 6.1 * 0.5 * S1/2, or S = (6.10.5/0.019)2 or S ≈ 25,800.


0

This is another solution using an analytical method instead of a simulation.

Previously, I have simulated an unsure population to be one that its vote is random chance guessing. So out of n many voters, an unsure population would tend to vote leave or remain for 0.5 of the time.

In order for an unsure population to get exactly 51.9% vote on leave, there needs to be 17,421,887 1s in Oleave. The probability for this is 0.533,568,184. Similarly, the probability of getting 17,421,887+1 votes is also 0.533,568,184. This goes on.

This is the probability of getting 17,421,887 votes:

i=17,421,88733,568,1840.533,568,184=(33,568,18417,421,887)×0.533,568,184=8.39663381928984×10101050240

(8.39663381928984×1010105024 calculated by Wolframalpha)

And this is the probability of having 51.9% of an unsure population vote leave.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.