In Nate Silvers Buch The Signal and the Noise schreibt er Folgendes, das möglicherweise einen Einblick in Ihre Frage bietet:
Einer der wichtigsten Tests einer Prognose - ich würde behaupten, es ist der wichtigste - heißt Kalibrierung. Wie oft hat es tatsächlich geregnet, obwohl Sie eine Regenwahrscheinlichkeit von 40% angegeben haben? Wenn es auf lange Sicht wirklich ungefähr 40% der Zeit geregnet hat, bedeutet dies, dass Ihre Vorhersagen gut kalibriert waren. Wenn es stattdessen nur 20 Prozent der Zeit oder 60 Prozent der Zeit regnete, war dies nicht der Fall.
Das wirft also ein paar Punkte auf. Zunächst einmal können Sie, wie Sie zu Recht betonen, anhand des Ergebnisses des Ereignisses, das Sie prognostizieren, keine Aussage über die Qualität einer einzelnen Prognose treffen. Das Beste, was Sie tun können, ist zu sehen, wie sich Ihr Modell im Verlauf vieler Vorhersagen verhält.
Eine weitere wichtige Überlegung ist, dass die Vorhersagen von Nate Silver kein Ereignis selbst sind, sondern die Wahrscheinlichkeitsverteilung des Ereignisses. Im Falle eines Präsidentenrennens schätzt er die Wahrscheinlichkeitsverteilung, mit der Clinton, Trump oder Johnson das Rennen gewinnen. In diesem Fall schätzt er eine multinomiale Verteilung.
Tatsächlich prognostiziert er das Rennen aber weitaus genauer. Seine Vorhersagen schätzen die Wahrscheinlichkeitsverteilungen des Prozentsatzes der Stimmen, die jeder Kandidat in jedem Staat erhalten wird. Wenn wir also 3 Kandidaten betrachten, könnte dies durch einen Zufallsvektor der Länge 51 * 3 charakterisiert werden, der Werte im Intervall [0, 1] annimmt, unter der Bedingung, dass die Proportionen für die Proportionen innerhalb eines Zustands zu 1 addieren. Die Zahl 51 ist, weil andere 50 Staaten + DC sind (und ich denke, es sind tatsächlich ein paar mehr, weil einige Staaten ihre Wahlkollegialstimmen aufteilen können), und die Zahl 3 ist auf die Anzahl der Kandidaten zurückzuführen.
Jetzt haben Sie nicht sehr viele Daten, mit denen Sie seine Vorhersagen bewerten können - er hat nur Vorhersagen für die letzten 3 Wahlen geliefert, die mir bekannt sind (gab es mehr?). Daher glaube ich nicht, dass es eine Möglichkeit gibt, sein Modell fair zu bewerten, es sei denn, Sie hatten das Modell tatsächlich in der Hand und konnten es anhand simulierter Daten bewerten. Aber es gibt noch einige interessante Dinge, die Sie anschauen könnten. Ich denke zum Beispiel, es wäre interessant zu sehen, wie genau er die Stimmanteile von Bundesstaat zu Bundesstaat zu einem bestimmten Zeitpunkt vorhergesagt hat, z. B. eine Woche vor der Wahl. Wenn Sie dies für mehrere Zeitpunkte wiederholen, z. B. für eine Woche, einen Monat, 6 Monate und ein Jahr, können Sie einige interessante Erklärungen für seine Vorhersagen abgeben. Eine wichtige Einschränkung: Die Ergebnisse sind in den einzelnen Bundesstaaten einer Wahl stark korreliert, sodass Sie nicht wirklich sagen können, dass Sie 51 * 3 Bundesstaaten-unabhängige Vorhersageinstanzen haben. . Aber vielleicht würde ich sowieso so darüber nachdenken, nur damit Sie genug Daten haben, um irgendetwas Sinnvolles damit zu tun.