Im Gegensatz zu anderen Antworten würde ich argumentieren, dass Sie angesichts der verfügbaren Daten etwas über die Fähigkeiten von Bolts sagen können. Lassen Sie uns zunächst Ihre Frage einschränken. Sie fragen nach dem schnellsten Menschen, aber da es einen Unterschied in der Verteilung der Laufgeschwindigkeiten für Männer und Frauen gibt, bei denen die besten Frauen etwas langsamer zu sein scheinen als die besten Männer, sollten wir uns auf Männer konzentrieren. Um einige Daten zu erhalten, können wir die besten Jahresergebnisse von 100 Läufen der letzten 45 Jahre betrachten . Es gibt verschiedene Dinge, die bei diesen Daten zu beachten sind:
- Das sind die besten Laufzeiten, also erzählen sie nicht von den Fähigkeiten aller Menschen, sondern von den minimal erreichten Geschwindigkeiten.
- Wir gehen davon aus, dass diese Daten eine Auswahl der besten Läufer der Welt widerspiegeln. Es könnte sein, dass es noch bessere Läufer gab, die nicht an den Meisterschaften teilgenommen haben, aber diese Annahme scheint ziemlich vernünftig zu sein.
Lassen Sie uns zunächst erläutern, wie Sie diese Daten nicht analysieren können. Sie könnten feststellen, dass wir, wenn wir die Laufzeiten gegen die Zeit zeichnen, eine starke lineare Beziehung beobachten würden.
Dies könnte dazu führen, dass Sie mithilfe der linearen Regression prognostizieren, wie viel bessere Läufer wir in den nächsten Jahren beobachten können. Dies wäre jedoch eine sehr schlechte Idee, die unvermeidlich zu dem Schluss führen würde, dass Menschen in ungefähr zweitausend Jahren in der Lage wären, 100 Meter in null Sekunden zu rennen, und danach würden sie anfangen, die negativen Laufzeiten zu erreichen! Dies ist natürlich absurd, da wir uns vorstellen können, dass es eine biologische und physikalische Grenze unserer Fähigkeiten gibt, die uns unbekannt ist.
Y.= max ( X1, X2, … , Xn) wobei unabhängige und identisch verteilte Zufallsvariablen sind, dann folgen einer GEV-Verteilung. Wenn Sie Minimas modellieren möchten, dann sind Z_1, Beispiele für Minimas, dannX1, X2, … , XnY.ichZ1, Z2, … , Zk- Zich's folgen einer GEV-Distribution für Minimas. So können wir die GEV-Verteilung an die Laufgeschwindigkeitsdaten anpassen, was zu einer ziemlich guten Anpassung führt (siehe unten).
Wenn Sie sich die vom Modell vorgeschlagene kumulative Verteilung ansehen, werden Sie feststellen, dass die beste Laufzeit von Usain Bolt bei der niedrigsten1 %Ende der Verteilung. Wenn wir uns also an diese Daten und diese Spielzeugbeispielanalyse halten, würden wir den Schluss ziehen, dass die wesentlich kürzeren Laufzeiten unwahrscheinlich (aber offensichtlich möglich) sind. Das offensichtliche Problem bei dieser Analyse ist, dass wir die Tatsache ignorieren, dass sich die besten Laufzeiten von Jahr zu Jahr verbessert haben. Dies bringt uns zurück zu dem im ersten Teil der Antwort beschriebenen Problem, dass die Annahme eines Regressionsmodells hier riskant ist. Eine andere Sache, die verbessert werden könnte, ist, dass wir den Bayes'schen Ansatz anwenden und voraussetzen könnten, dass einiges an Wissen über die physiologisch möglichen Laufzeiten vorliegt, das möglicherweise noch nicht beobachtet wurde (aber, soweit ich weiß, dies ist derzeit nicht bekannt). Eine ähnliche Extremwerttheorie wurde schließlich bereits in der Sportforschung angewendet, z. B. von Einmahl und Magnus (2008) imRekorde in der Leichtathletik durch das Papier der Extreme Value Theory .
Sie könnten protestieren, dass Sie nicht nach der Wahrscheinlichkeit der schnelleren Laufzeit gefragt haben, sondern nach der Wahrscheinlichkeit, einen schnelleren Läufer zu beobachten. Leider können wir hier nicht viel tun, da wir nicht wissen, wie hoch die Wahrscheinlichkeit ist, dass ein Läufer ein Profisportler wird und ihm die aufgezeichneten Laufzeiten zur Verfügung stehen. Dies geschieht nicht zufällig und es gibt viele Faktoren, die dazu beitragen, dass einige Läufer zu Profisportlern werden und andere nicht (oder sogar, dass jemand gerne rennt und überhaupt rennt). Dazu müssten wir detaillierte bevölkerungsweite Daten zu Läufern haben. Da Sie außerdem nach den Extremen der Verteilung fragen, müssten die Daten sehr umfangreich sein. In diesem Punkt stimme ich den anderen Antworten zu.