Intelligence Squared Scoring und Gewinnerermittlung


12

Es gibt einen NPR-Podcast namens Intelligence Squared. Jede Folge ist eine Ausstrahlung einer Live-Debatte über umstrittene Aussagen wie "Die zweite Änderung ist nicht mehr relevant" oder "Affirmative Action auf dem College-Campus schadet mehr als nützt". Vier Vertreter debattieren - zwei für den Antrag und zwei dagegen.

Um festzustellen, welche Seite gewinnt, wird das Publikum vor und nach der Debatte befragt. Die Seite, die in absoluten Prozentsätzen mehr gewonnen hat, gilt als Sieger. Beispielsweise:

          For    Against  Undecided
 Before   18%      42%       40%
 After    23%      49%       28%

 Winner: Against team -- The motion is rejected.

Intuitiv denke ich, dass dieses Erfolgsmaß voreingenommen ist, und ich frage mich, wie man das Publikum befragen würde, um den Gewinner auf faire Weise zu bestimmen.

Drei Probleme sehe ich sofort mit der aktuellen Methode:

  • Wenn im Extremfall eine Seite mit 100% iger Übereinstimmung beginnt, kann sie nur binden oder verlieren.

  • Wenn es keine Unentschlossenheit gibt, kann die Seite mit weniger anfänglicher Übereinstimmung als eine größere Stichprobe angesehen werden, aus der gezogen werden kann.

  • Die unentschlossene Seite dürfte nicht wirklich unentschlossen sein. Wenn wir davon ausgehen, dass beide Seiten gleich polarisiert sind, sollte unsere vorherige Überzeugung von der unentschlossenen Bevölkerung wenn jeder gezwungen wurde, eine Seite zu vertreten.Beta(# Zum,# Gegen)

Gibt es angesichts der Tatsache, dass wir uns auf die Befragung der Zuschauer verlassen müssen, eine gerechtere Möglichkeit zu beurteilen, wer gewinnt?


1
Ich würde denken, dass so etwas wie das "For-Against Ratio-After" geteilt durch das "For-Against Ratio-Before" (im Wesentlichen ein Odds Ratio) eine bessere Wahl wäre. Wenn es höher als 1 ist, haben Sie die Chancen verbessert, wenn es weniger als 1 ist, haben Sie nicht.
Glen_b -Reinstate Monica

Das war auch mein erster Gedanke, obwohl ich ihn als prozentualen Gewinn formuliert habe. Ich bin mir nur nicht sicher, wie ich beweisen soll, dass es sich um eine unvoreingenommene Schätzung handelt.
Wesley Tansey

Eine unvoreingenommene Schätzung von was? Ich bin nicht sicher, ob Unparteilichkeit eine besonders wünschenswerte Eigenschaft dafür ist.
Glen_b -Reinstate Monica

Wie gut sich jede Seite geschlagen hat. Idealerweise möchten wir das Ergebnis nicht auf der Grundlage der anfänglichen Reaktion der Menge beeinflussen. Oder ich denke über diese völlig falsch ...
Wesley Tansey

Ah, ich denke, wir verwenden Voreingenommenheit auf eine etwas andere Art und Weise. Ob mein Vorschlag in diesem Sinne voreingenommen ist, hängt davon ab, was genau Sie messen möchten. Mit einer populären Maßnahme wird dieses Problem perfekt gelöst.
Glen_b -Reinstate Monica

Antworten:


10

Ihre Bedenken sind begründet. Leider gibt es viele vertretbare, objektive Wege, um dieses Problem zu lösen, und sie können miteinander in Konflikt geraten. Die folgende Analyse bietet einen Rahmen für die Entscheidung, wie Sie das Ergebnis bewerten möchten, und zeigt, wie abhängig Ihre Schlussfolgerungen von Annahmen sind, die Sie über die Dynamik der Situation treffen.


Wir haben wenig oder keine Kontrolle über das ursprüngliche Publikum. Möglicherweise handelt es sich nicht um eine größere Population (wie alle Zuschauer), an der wir mehr interessiert sind. Daher absolute Zahl der Meinungen sind von geringer Bedeutung: welche Fragen die sind Raten bei denen die Menschen ihre Meinung ändern könnten. (Anhand dieser Raten können wir abschätzen, wie sich die Hörerpopulation ändern könnte, wenn Informationen zu ihren ursprünglichen Meinungen vorliegen, selbst wenn sich die Anteile der Meinungen im Hörerpublikum von den befragten Studiopublikum unterscheiden.)

Das Ergebnis besteht daher aus sechs möglichen Meinungsänderungen und sechs damit verbundenen Änderungsraten:

  • Diejenigen , „denn“ , den ich Index mit können ihre Meinung ändern und am Ende entweder gegen (mit dem Index 2 ) mit einer Rate ein 12 oder unentschieden (mit dem Index 3 ) mit einer Rate ein 13 .1,2a123a13

  • Diejenigen , „gegen“ können ihre Meinung ändern zu „für“ mit einer Rate oder „unentschieden“ mit einer Rate ein 23 .a21a23

  • Die Unentschlossenen können ihre Meinung „für“ mit einer Rate ändern oder „gegen“ mit einer Rate ein 32 .a31a32.

Definieren Sie , für i = 1 , 2 , 3 , um den Anteil der Personen mit Index zu bezeichnen, über den ich meine Meinung nicht ändere.aiii=1,2,3,i

Die Spalten der Matrix A=(aij) enthalten nichtnegative Zahlen, die zur Einheit addieren müssen (vorausgesetzt, jeder, der auf die erste Umfrage antwortet, antwortet auch auf die letzte). Es bleiben also sechs unabhängige Werte, die basierend auf dem Übergang von der Anfangsverteilung im Publikum zur Endverteilung y = ( 0,23 , 0,49 , 0,28 ) = A x zu bestimmen sindx=(0.18,0.42,0.40)y=(0.23,0.49,0.28)=Ax. Dies ist ein unterbestimmtes System von (eingeschränkten) linearen Gleichungen, das enorme Flexibilität bei der Ableitung einer Lösung bietet. Schauen wir uns drei Lösungen an.

Lösung 1: Am wenigsten Veränderung

Wir könnten die Übergangsmatrix bitten , in gewissem Sinne so klein wie möglich zu sein. Eine Möglichkeit ist es, die insgesamt zu minimieren Anteile von Menschen , die ihre Meinung ändern. Dies geschieht im Beispiel mit der LösungA

A=(100.125010.175000.700).

Das heißt, der Unentschlossenen endeten für, 17,5 % von ihnen endeten gegen und keines der ursprünglichen Fors oder Againsts änderte ihre Meinung. Wer gewann? Die Gegenargumente, offensichtlich, weil die Debatte einen größeren Teil der Unentschlossenen dazu überredete, sich mit der "Gegenargument" -Stellungnahme zufrieden zu geben.12.5%17.5%

Dieses Modell wäre angebracht, wenn Sie glauben, dass die anfänglichen Fraktionen auf ihre Meinung festgelegt sind und die einzigen Personen, die ihre Meinung ändern können, zu denjenigen gehören, die ursprünglich für unentschlossen erklärt wurden.

Lösung 2: Kleinste Quadrate

Eine mathematisch einfache Lösung besteht darin, die Matrix zu finden, deren quadratische L 2 -Norm | | A | | 2 2AL2 ist so klein wie möglich: Dies minimiert die Summe der Quadrate aller neun Übergangswahrscheinlichkeiten (einschließlich des a i i, das die Proportionen darstellt, die ihre Meinung nicht ändern). Die Lösung (auf zwei Dezimalstellen gerundet) lautet||A||22=tr(AA)aii

A=(0.280.220.220.410.510.500.310.270.28).

Wenn wir die Zeilen vergleichen, sehen wir, dass der Gegenseite dazu überredet wurden, in "for" zu konvertieren (und weitere 27 %).22%27% ausreichend verwirrt waren, um unentschlossen zu werden), jedoch der "für" -Seite vollständig umgewandelt wurden (und weitere 31 % waren verwirrt). Die ursprünglichen Unentschlossenen tendierten dazu, sich zur "Gegenseite" zu bekehren ( 50 % gegenüber 22 % ). Jetzt ist "gegen" der klare Gewinner.41%31%50% 22%

Die Lösung mit den kleinsten Quadraten ist in der Regel mit einer großen Veränderung in jeder Gruppe verbunden. (Vorbehaltlich der Einschränkungen des Problems wird es versuchen , die Änderungen alle gleich machen .) Ob es zu einer realistischen Darstellung der Bevölkerung entspricht schwer zu bestimmen, aber es mathematisch möglich Bild nicht zeigt , was passiert ist während der Debatte.1/3

Lösung 3: Bestrafte kleinste Quadrate

Um die Häufigkeit zu kontrollieren und zu begrenzen, mit der Menschen ihre Meinung ändern, bestrafen wir das Ziel der kleinsten Fehlerquadrate, indem wir Begriffe einfügen, die keine Meinungsänderung begünstigen. Dies sind die Bedingungen auf den Diagonalen von . Wir könnten annehmen, dass es schwieriger ist, die Meinung von jemandem zu ändern, der nicht unentschlossen ist, also wäre es gut, letzteren zu beschneiden. Führen Sie dazu positive Gewichte ω i ein und finden Sie A für welches | | A | | 2 2 - ω 1 a 11 - ω 2 a 22 - ω 3 a 33 wird minimiert.AωiA

||A||22ω1a11ω2a22ω3a33

Zum Beispiel wollen wir die Unentschlossenen um 50% downweight durch Gewichte Auswählen . Die (gerundete) Lösung istω=(1,1,1/2)

A=(0.9100.170.030.930.230.060.070.60).

Diese Lösung liegt zwischen den ersten beiden: Ein kleiner Teil der engagierten Seiten hat seine Meinung geändert oder ist unentschlossen, während der Unentschlossenen eine Entscheidung getroffen haben ( 17 % dafür und 23 % dagegen). Aber auch hier sprechen die Ergebnisse eindeutig für die "gegen" -Fraktion.40%17%23%

Zusammenfassung

In diesem Übergangsmodell der Meinungsänderung geben die meisten Lösungsmethoden in diesem speziellen Beispiel einen Gewinn für die "gegen" -Seite an. Fehlen irgendwelche starken Meinungen über die Dynamik des Wandels, die darauf hindeuten, dass die "Gegenseite" gewonnen hat.

(.20,.60,.20)(.30,.40,.30)20%30%40%30%. Die (gerundete) Lösung der kleinsten Quadrate deutet jedoch zumindest darauf hin, dass es eine Möglichkeit gibt, wie dies geschehen könnte, bei der die Debatte die andere Seite leicht begünstigt! Es ist

A=(0.320.290.320.360.420.360.320.290.32).

36%29%(36%) 32%

zusätzliche Kommentare

A

A


Danke für den ausführlichen Beitrag! Ich bin jedoch besorgt, dass all diese Methoden nicht die Möglichkeit in Betracht ziehen, dass die Unentschlossenen nicht wirklich unentschlossen sind.
Wesley Tansey

Sie haben die Flexibilität, Ihre Bedenken in Bezug auf diese Möglichkeit einzubringen. Sie müssen immer noch (starke) Annahmen treffen: Wenn Sie der Meinung sind, dass sie nicht wirklich entschieden sind, müssen Sie abschätzen, welches Verhältnis "für" und welches Verhältnis "gegen" ist (und es wäre Unsinn anzunehmen) Die Proportionen sind die gleichen wie die Zahl für: Zahl gegen!) Ein Weg, um eine solche Schätzung zu umgehen, besteht darin, eine Lösung zu wählen, die eine Meinungsänderung einer unentschlossenen Person belohnt.
Whuber

Angenommen, beide Seiten sind gleich polarisierend, wäre Ihre MAP-Schätzung der Unentschlossenen nicht das Für: Gegen-Verhältnis?
Wesley Tansey

In den meisten Fällen wäre es schwierig, eine solche Annahme zu stützen. Zum Beispiel neigen weniger informierte Menschen eher dazu, unentschlossen zu sein - und auch dazu, irgendwann eine der beiden Positionen zu bevorzugen. Der Effekt einer "gleich polarisierenden" Annahme könnte so stark sein (insbesondere bei einem großen Anteil von Unentschlossenen), dass eine nachfolgende Analyse nebensächlich wird: Die Ergebnisse wären in erster Linie eine Folge dieser Annahme. Ein produktiver Gedanke für Sie könnte sein, zusätzliche Informationen über die unentschlossenen Personen zu sammeln.
whuber

3

p(zumnach,gegennach,unentschiedennachzumVor,gegenVor,unentschiedenVor)
und setzen Sie die Gewinnregel als Funktion der Vor-Debatten-Umfrage so, dass die vorhersagbare Gewinnwahrscheinlichkeit ist 0,5für beide Mannschaften. Beachten Sie, dass es für die Entscheidungsregel immer noch mehrere Möglichkeiten gibt, da der Ergebnisraum zweidimensional ist. Wenn wir jedoch dem Vorhersagemodell vertrauen, spielt dies für die Fairness des Wettbewerbs keine Rolle. Man könnte zum Beispiel einfach entscheiden, dass das For-Team gewinnt, wenn das For-Against-Verhältnis nach der Debatte den prädiktiven Median überschreitet (abhängig von der Vorabumfrage).

Ideen zur Erstellung eines Vorhersagemodells

Anfangs dachte ich nur an ein "Black-Box" -Modell der Nachwahlnummern als Funktion der Vorwahlnummern und des Rauschens. Ein besserer Ansatz könnte jedoch darin bestehen, Whubers Idee zu übernehmen, die Übergangswahrscheinlichkeiten zu berücksichtigen. Der einfachste (wenn auch nicht realistische) Ansatz wäre, die Übergangswahrscheinlichkeiten als unabhängig von den vor der Debatte durchgeführten Abstimmungsergebnissen zu betrachten. Angenommen, die Übergangswahrscheinlichkeiten stammen aus Dirichlet-Verteilungen:

(P(forfor before),P(udfor before),P(agfor before))Dir(aff,auf,aaf)(P(forud before),P(udud before),P(agud before))Dir(afu,auu,aau)(P(forag before),P(udag before),P(agag before))Dir(afa,aua,aaa),
where the Ps are transition probabilities for individuals and the as are hyperparameters that control how the transition probabilities vary from debate to another. The as are learned from data of previous shows, either by optimizing point estimates (e.g. maximum a posteriori or maximum likelihood) these, or a full Bayesian solution that outputs a posterior distribtuion of the as. One could also add some symmetry constraints if one wants to assume for and against behave similarly (before knowing the particular debate question) e.g., aff=aaa, afu=aau.

Given posterior distributions or point estimates of as, and the distribution of individuals in current before poll (that I now assumed to be independent of the transition probabilities), it is straightforward to simulate the distribution of after-debate-poll numbers, and then pick the median of, e.g., for/against-ratio as the winning threshold.


Could you expand on the idea of a predictive model with an example?
Wesley Tansey

@WesleyTansey I realized one could use whuber's idea of considering the transition probabilities to construct a predictive model for the purposes of my answer. I edited my answer to contain some initial ideas, but I have not tried implementing this nor am I currently planning to.
Juho Kokkala
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.