Das Konzept der "statistisch bewiesen"


10

Wenn die Nachrichten über Dinge sprechen, die statistisch bewiesen wurden, verwenden sie ein genau definiertes Konzept der Statistik richtig, falsch oder nur ein Oxymoron?

Ich stelle mir vor, dass ein "statistischer Beweis" nicht tatsächlich als Beweis für eine Hypothese oder einen mathematischen Beweis durchgeführt wird, sondern eher als "statistischer Test".


10
Es gibt keinen Beweis in der Statistik, außer dass Beweise in der mathematischen Statistik mathematischen Standards folgen sollten. Solche Beweise sind jedoch für Ihre Frage irrelevant. In Bezug auf Ihr Beispiel behauptet niemand außer einem Idioten oder Humoristen, dass jede amerikanische Familie 2,4 Kinder hat. Allenfalls wird behauptet, dass Familien im Durchschnitt 2,4 Kinder haben; Dies kann durch Stichprobenerhebungen oder eine andere Volkszählung überprüft werden. Da die Anzahl jedoch schwanken oder sich systematisch ändern kann, bedeutet ein anderes Ergebnis nicht, dass das erste Ergebnis falsch war. Das gleiche Ergebnis bedeutet auch nicht, dass das erste Ergebnis korrekt war.
Nick Cox

Antworten:


16

Worüber die Nachrichten sprechen, ist jedermanns Vermutung und variiert mit der Nachrichtensendung. Am häufigsten ist es vielleicht, dass sie eine Zusammenfassung der Forschung mit einem Satz geben, die mehrere Seiten erfordert.

Ihr letzter Absatz ist jedoch falsch. Statistisch gesehen hat jede Familie NICHT 2,4 Kinder. Der Mittelwert liegt bei 2,4 Kindern. Dies ist durchaus möglich. Wenn Sie eine zufällige Stichprobe amerikanischer Familien nehmen (schwierig, aber möglich), erhalten Sie eine Schätzung des Mittelwerts. Wenn Sie jedoch eine Familienzählung durchgeführt haben, wenn die Volkszählung wirklich jede Familie erfasst hat (nicht) oder wenn die Personen, die sie erhalten hat, repräsentativ für die Personen sind, die sie nicht erhalten hat, in Bezug auf die Anzahl der Kinder, dann hättest du das bewiesen.

Die Volkszählung vermisst jedoch nicht nur Menschen, die Menschen, die sie vermisst, unterscheiden sich in vielerlei Hinsicht von den Menschen, die sie bekommt. Das Census Bureau versucht daher herauszufinden, wie unterschiedlich sie sind. Auf diese Weise wird erneut die Anzahl der Kinder pro Familie geschätzt.

Aber es gibt Dinge, die Sie beweisen können; Wenn Sie beispielsweise wissen möchten, wie viele Jahre durchschnittlich jeder Professor in Ihrer Abteilung unterrichtet hat, können Sie genaue Daten abrufen und einen genauen Mittelwert ermitteln.

Ihr vorletzter Absatz ist ebenfalls problematisch, da statistische Tests genau durchgeführt werden, um Hypothesen zu beweisen. genauer gesagt, sie werden (jedenfalls im Rahmen des Frequentismus) durchgeführt, um eine Nullhypothese auf einem bestimmten Signifikanzniveau abzulehnen.


Meine Frage wurde korrigiert.
Quora Feans

5

Ich denke - wie bei so vielen Dingen - ist es eine Kombination aus einem weit verbreiteten kulturellen Missverständnis und journalistischen Versuchen einer schlagkräftigen Kurzschrift, die sich manchmal als irreführend herausstellt.

" Handys verursachen Krebs! " Verkauft mehr Anzeigen als eine Erklärung zur Untersuchung eines möglichen Links.

Natürlich sind Schlussfolgerungen, die auf statistischen Schlussfolgerungen beruhen, in keiner Weise ein Beweis. Es hängt von Annahmen ab, und selbst dann sind Schlussfolgerungen (bestenfalls) probabilistisch (wie wir beispielsweise bei der Bayes'schen Inferenz erhalten), und dann müssen Sie bei der frequentistischen Inferenz den üblichen Fehler der Fehlinterpretation von p-Werten als die Wahrscheinlichkeit hinzufügen, dass die null ist wahr. Dies ohne Berücksichtigung von Themen wie Veröffentlichung oder Berichterstattung

Sie sehen ähnliche Fehler genauso häufig bei der wissenschaftlichen Berichterstattung im Allgemeinen und es ist genauso frustrierend .

Ich mag den Ausdruck "statistisch bewiesen" selbst nicht, da ich denke, dass er den falschen Eindruck vermittelt. Gut gemachte Statistiken sind zwar ein mächtiges Werkzeug, aber die Dinge, die uns die Statistik tatsächlich sagt, können überraschend subtil sein, und die angemessene Diskussion der Bedeutung des Gelernten und der damit verbundenen Qualifikationen, die in den Schlussfolgerungen enthalten sind, sind oft nicht für den Hype und die Schlagkraft einer Überschrift geeignet Ein paar hastige Absätze drängten sich zwischen den üblichen Promi-Gerüchten.

Selbst in Fachzeitschriften, in denen solche Qualifikationen als wesentlich erscheinen, werden sie häufig beiseite gelassen, und stattdessen erscheint eine formelhafte Aussprache (von Forschungsgebiet zu Forschungsgebiet unterschiedlich), die als "Salbung" des Ergebnisses angesehen wird.

Ich denke, es gibt Raum für eine sorgfältige Erklärung der Argumentation, die von den Ergebnissen der Inferenz (ob Punkt- und Intervallschätzung, Hypothesentest, entscheidungstheoretische Berechnungen oder sogar explorative Konstruktion einiger visueller Vergleiche) bis zu den Schlussfolgerungen reicht, zu denen sie führen. In dieser Argumentation liegt das eigentliche Herz der Sache (einschließlich der Lücken in der Argumentation, wenn sie explizit wären), und wir sehen sie selten dargelegt.

Außerdem können wir weiterhin Vorsicht walten lassen


(+1) Können Sie bitte jede meiner zukünftigen Arbeiten überprüfen?
Matt Krause

2
Es könnte dir nicht gefallen. Mehr als einmal sind die Berichte meines Schiedsrichters deutlich länger als das Originalpapier, da ich im Detail durchgehe, was falsch ist und wie es behoben werden kann (meistens nur, um die Antwort zu erhalten, ganze Papierabschnitte auszuschneiden, anstatt zu versuchen, sie zu reparieren die problematischsten, aber normalerweise interessantesten Teile, leider). Eine meiner Schülerinnen hatte einen ähnlich detaillierten Bericht über ihre Arbeit von einem ihrer Schiedsrichter; es war tatsächlich ziemlich wertvoll und führte zu einem viel besseren Endprodukt.
Glen_b -State Monica

-2

Empirisches Wissen ist immer probabilistisch - niemals eindeutig wahr oder falsch, sondern immer irgendwo dazwischen. Beim statistischen "Beweis" geht es darum, genügend Daten zu sammeln, um die Wahrscheinlichkeit, dass eine Hypothese falsch ist, auf weniger als einen akzeptierten Schwellenwert zu reduzieren. Und die Schwelle für "Wahrheit" oder "Korrektheit" unterscheidet sich von einer akademischen Disziplin zur nächsten. Soziologen sind mit einer Wahrscheinlichkeit von 95% zufrieden und geben sich manchmal mit weniger zufrieden. Quantenphysiker fordern 99,99999% oder besser.


2
Willkommen auf der Website, @Kevin Krumwiede. Ihr letzter Satz ist mehrdeutig. Es scheint, als ob Sie einen häufigen Fehler machen, der einen p-Wert von <0,05 (z. B.) mit einer Wahrscheinlichkeit von 95% zusammenführt, dass die Nullhypothese falsch ist.
Gung - Reinstate Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.