Soll ich zuerst Bayesian oder Frequentist Statistik unterrichten?


32

Ich helfe meinen Jungen, die gerade in der Highschool sind, Statistiken zu verstehen, und ich denke darüber nach, mit ein paar einfachen Beispielen zu beginnen, ohne dabei einige Einblicke in die Theorie zu ignorieren.

Mein Ziel wäre es, ihnen den intuitivsten und doch instrumentell konstruktivsten Ansatz zu geben, um Statistiken von Grund auf neu zu lernen, um ihr Interesse an der weiteren Verfolgung von Statistiken und quantitativem Lernen zu wecken.

Bevor ich anfange, habe ich jedoch eine bestimmte Frage mit sehr allgemeinen Auswirkungen:

Sollten wir anfangen, Statistik mit einem Bayes'schen oder einem frequentistischen Rahmen zu unterrichten?

Nachforschungen haben ergeben, dass ein gemeinsamer Ansatz mit einer kurzen Einführung in die frequentistische Statistik beginnt, gefolgt von einer eingehenden Erörterung der Bayes'schen Statistik (z . B. Stangl ).


5
Ihre Frage ist ohne weiteren Kontext schwer zu beantworten. Was möchten Sie erreichen?
Glen_b

4
Es ist eine schlechte Erziehung, Kindern Bayesianische Statistiken beizubringen, ähnlich wie sie Wodka einschenken oder Zigarren anzünden. Beachten Sie, dass sowohl Wodka als auch Zigarren für Erwachsene in Ordnung sind, solange sie diese selbst
entdecken

2
@Aksakal Ich hatte eigentlich vor, ihnen das Bayes-Theorem beizubringen, während ich Wodka nippte und Havannas paffte ... ;-)
Joe_74

2
Das ist ein guter Weg, um Kinder für ein paar Jahre von Bayes-Statistiken fernzuhalten. Sie sagen ihnen, dass dies nur die Bayes-Theorem-Anwendungen sind. Der Satz funktioniert gut in frequentistischen Statistiken
Aksakal

5
Nate Silvers Buch "Das Signal und das Rauschen" ist ein Argument dafür, jungen Menschen Bayes'sche Statistik beizubringen.
Lloyd Christmas

Antworten:


25

Sowohl die Bayes-Statistik als auch die Frequentist-Statistik basieren auf der Wahrscheinlichkeitstheorie, aber ich würde sagen, dass die erstere von Anfang an stärker auf der Theorie beruht. Andererseits ist das Konzept eines glaubwürdigen Intervalls sicherlich intuitiver als das eines Konfidenzintervalls, wenn der Schüler das Konzept der Wahrscheinlichkeit erst einmal richtig verstanden hat. Also, was auch immer Sie wählen, ich befürworte zuallererst, ihr Verständnis von Wahrscheinlichkeitskonzepten zu stärken, mit all diesen Beispielen, die auf Würfeln, Karten, Roulette, Monty Hall-Paradox usw. basieren.

Ich würde den einen oder den anderen Ansatz auf der Grundlage eines rein utilitaristischen Ansatzes wählen: Studieren sie in der Schule häufiger frequentistische oder bayesianische Statistiken? In meinem Land würden sie auf jeden Fall zuerst das frequentistische Gerüst lernen (und zuletzt: Sie haben noch nie von Schülern gehört, denen Bayes-Statistiken beigebracht wurden. Die einzige Chance besteht entweder an der Universität oder danach im Selbststudium). Vielleicht ist es bei Ihnen anders. Denken Sie daran, dass, wenn sie sich mit NHST (Null Hypothesis Significance Testing) befassen müssen, dies natürlicher im Kontext der frequentistischen Statistik, IMO, auftritt. Natürlich können Sie Hypothesen auch im Bayes'schen Rahmen testen, aber es gibt viele führende Bayes'sche Statistiker, die sich dafür aussprechen, NHST überhaupt nicht zu verwenden, weder im Frequentist- noch im Bayes'schen Rahmen (zum Beispiel Andrew Gelman von der Columbia University).

Schließlich weiß ich nicht, wie hoch das Niveau der Gymnasiasten in Ihrem Land ist, aber in meinem Fall wäre es für einen Schüler wirklich schwierig, gleichzeitig Wahrscheinlichkeitstheorie und Integralrechnung (die Grundlagen der Wahrscheinlichkeitstheorie) erfolgreich zu verarbeiten. Wenn Sie sich also für die Bayes'sche Statistik entscheiden, würde ich den Fall der kontinuierlichen Zufallsvariablen wirklich vermeiden und mich an diskrete Zufallsvariablen halten.


2
Ich hatte den Eindruck (nach dem Lesen seines Blogs), Andrew Gelman würde sich sowohl gegen das frequentistische NSHT als auch gegen Bayesian einsetzen.
Psarka

2
@psarka ja, klar - ich habe nie das Gegenteil gesagt.
DeltaIV

3
"In meinem Land würden sie definitiv zuerst die häufig anzutreffenden Rahmenbedingungen lernen" - Dies (oder das völlige Weglassen der Diskussion über den Bayesianismus) ist der traditionelle Ansatz weltweit.
Kodiologist

1
@Kodiologist Ich vermutete so viel. Zumindest kann es einige Bildungssysteme geben, in denen nach dem frequentistischen Rahmen auch das Bayesianische in der High School eingeführt wird. Aber das ist hier nicht der Fall.
DeltaIV

22

Bayesianer und Frequentist stellen unterschiedliche Fragen. Bayesian fragt, welche Parameterwerte angesichts der beobachteten Daten glaubwürdig sind. Der Frequentist fragt nach der Wahrscheinlichkeit von imaginären simulierten Daten, wenn einige hypothetische Parameterwerte wahr sind. Häufige Entscheidungen beruhen auf Kontrollfehlern, Bayes'sche Entscheidungen auf Unsicherheiten in den Modellbeschreibungen.

Was solltest du zuerst unterrichten? Nun, wenn Sie die eine oder andere dieser Fragen zuerst stellen möchten, ist dies Ihre Antwort. Aber in Bezug auf Zugänglichkeit und Pädagogik denke ich, dass Bayesian viel einfacher zu verstehen und viel intuitiver ist. Die Grundidee der Bayes'schen Analyse ist die Umverteilung der Glaubwürdigkeit auf die verschiedenen Möglichkeiten, wie Sherlock Holmes es bereits sagte und die Millionen von Lesern intuitiv verstanden haben. Die Grundidee der frequentistischen Analyse ist jedoch sehr herausfordernd: Der Raum aller möglichen Datensätze, die sich ergeben könnten, wenn eine bestimmte Hypothese wahr wäre, und der Anteil der imaginären Datensätze, deren Zusammenfassungsstatistik mindestens so extrem ist wie die Zusammenfassung tatsächlich beobachtete Statistik.

Ein kostenloses Einführungskapitel über Bayes'sche Ideen finden Sie hier . Ein Artikel, der häufig auftretende und bayesianische Konzepte nebeneinander setzt, ist hier . Der Artikel erklärt häufig auftretende und bayesianische Ansätze zum Testen von Hypothesen und zur Schätzung (und viele andere Dinge). Der Rahmen des Artikels kann besonders für Anfänger nützlich sein, die versuchen, sich einen Überblick über die Landschaft zu verschaffen.


Das Einfügen von Kapiteltiteln und Artikeln kann hilfreich sein, falls die Links in Zukunft nicht mehr funktionieren.
Richard Hardy

8

Diese Frage könnte auf einer Meinung beruhen, deshalb werde ich versuchen, mich mit meiner Meinung kurz zu fassen und Ihnen dann einen Buchvorschlag zu machen. Manchmal lohnt es sich, einen bestimmten Ansatz zu wählen, da dies der Ansatz ist, den ein besonders gutes Buch verfolgt.

Ich würde zustimmen, dass Bayes-Statistiken intuitiver sind. Die Unterscheidung zwischen Konfidenzintervall und glaubwürdigem Intervall bringt es auf den Punkt: Die Leute denken natürlich in Begriffen wie "Was ist die Chance, dass ..." und nicht wie das Konfidenzintervall. Der Konfidenzintervall-Ansatz klingt sehr ähnlich wie das Glaubwürdige Intervall, mit der Ausnahme, dass Sie im Allgemeinen nicht den letzten Schritt von "95% der Zeit" zu "95% der Chance" machen können, was sehr häufig erscheint, aber Sie kann es nicht machen. Es ist nicht inkonsistent, nur nicht intuitiv.

Dies auszugleichen ist die Tatsache, dass die meisten College-Kurse, die sie belegen werden, den weniger intuitiven Ansatz des Frequentisten verwenden.

Das Buch Statistical Rethinking: A Bayesian Course mit Beispielen in R und Stan von Richard McElreath gefällt mir sehr gut. Es ist nicht billig, also lesen Sie es bitte durch und stöbern Sie bei Amazon, bevor Sie es kaufen. Ich finde es ein besonders intuitiver Ansatz, der den Bayes'schen Ansatz nutzt und sehr praktisch ist. (Und da R und Stan ausgezeichnete Werkzeuge für Bayesianische Statistiken sind und kostenlos sind, ist es praktisches Lernen.)

EDIT: In einigen Kommentaren wurde erwähnt, dass das Buch wahrscheinlich nicht für ein Abitur geeignet ist, selbst wenn ein erfahrener Tutor anwesend ist . Also muss ich noch eine Einschränkung machen: Am Anfang hat es eine einfache Herangehensweise, die sich aber schnell erhöht. Es ist ein erstaunliches Buch, aber Sie müssten es wirklich auf Amazon durchgehen, um ein Gefühl für seine anfänglichen Annahmen zu bekommen und wie schnell es ansteigt. Wunderschöne Analogien, großartige praktische Arbeit in R, unglaublicher Ablauf und Organisation, aber vielleicht nicht nützlich für Sie.

Es werden Grundkenntnisse in Programmierung und R (kostenloses Statistikpaket) sowie Grundkenntnisse in Wahrscheinlichkeit und Statistik vorausgesetzt. Es ist kein Direktzugriff und jedes Kapitel baut auf vorherigen Kapiteln auf. Es beginnt sehr einfach, obwohl die Schwierigkeit in der Mitte zunimmt - es endet in einer mehrstufigen Regression. Vielleicht möchten Sie einen Teil davon bei Amazon in der Vorschau anzeigen und entscheiden, ob Sie die Grundlagen problemlos erläutern können oder ob es etwas zu weit in die Tiefe springt.

EDIT 2: Das Fazit meines Beitrags hier und der Versuch, ihn von der reinen Meinung abzuwenden, ist, dass ein gutes Lehrbuch entscheiden kann, welchen Ansatz Sie wählen. Ich würde einen bayesianischen Ansatz bevorzugen, und dieses Buch macht das gut, aber vielleicht zu schnell.


2
McElreaths Buch ist exzellent, aber ich wäre wirklich überrascht, wenn Gymnasiasten diese Behandlungsstufe auch mit einem talentierten Tutor verfolgen könnten.
DeltaIV

2
@ DeltaIV: Gutes Feedback, ich bearbeite meine Antwort. Ich wurde mehrmals täuschen lassen, wie lesbar und analog es am Anfang ist. Etwa auf halbem Weg tritt es in eine steile Lernkurve ein, wahrscheinlich viel früher.
Wayne

1
Noch eine Anmerkung: Ich denke, es gibt eine größere Lücke zwischen den Grundlagen (dh der Wahrscheinlichkeitstheorie) und der Anwendung in Frequentist-Methoden gegenüber Bayes'schen Methoden. Das heißt, ich habe Schwierigkeiten, mir jemanden vorzustellen, der die MLE-Theorie, den Nachweis der CLT usw. wirklich versteht, ohne eine Ausbildung auf Hochschulniveau, die selbst für die grundlegendsten Verfahren des Frequentismus erforderlich ist. Wenn Sie die bedingte Wahrscheinlichkeit kennen, verstehen Sie im Grunde, wie die Bayes'sche Folgerung funktioniert. Die MCMC-Theorie ist ein bisschen knifflig, aber ehrlich gesagt viel einfacher, als die MLE-Theorie wirklich zu verstehen ...
Cliff AB

... und da es einfacher ist, die Lücke zwischen Wahrscheinlichkeit und Anwendung von Statistiken im Bayes'schen Rahmen zumindest zu schließen, denke ich, dass dies die Dinge geistig schneller befriedigt. Ich hasste es, die Kurse zu belegen, in denen wir sagten: "Und vertrau uns, die MLE-Theorie funktioniert mit großen Stichproben", weil ich der Meinung war, dass dies die wissenschaftliche Neugier eines Menschen etwas zerstören oder ein viel größeres geistiges Engagement erfordern musste.
Cliff AB

... Aber die Intuition hinter mle ist natürlich genug ... stats.stackexchange.com/questions/112451/…
kjetil b halvorsen

5

Mir wurde zuerst der frequentistische Ansatz beigebracht, dann der bayesianische. Ich bin kein professioneller Statistiker.

Ich muss zugeben, dass ich meine Vorkenntnisse des frequentistischen Ansatzes nicht als entscheidend für das Verständnis des Bayes'schen Ansatzes angesehen habe.

Ich wage zu sagen, es hängt davon ab, welche konkreten Anwendungen Sie Ihren Schülern als Nächstes zeigen und wie viel Zeit und Mühe Sie dafür aufwenden werden.

Nachdem ich das gesagt habe, würde ich mit Bayes beginnen.


3

Der Bayes'sche Rahmen ist eng mit allgemeinen Fähigkeiten zum kritischen Denken verknüpft. Es ist das, was Sie in den folgenden Situationen brauchen:

  1. Sie denken darüber nach, sich für einen wettbewerbsfähigen Job zu bewerben. Wie hoch sind Ihre Chancen einzusteigen? Welche Auszahlung erwarten Sie von Ihrer Bewerbung?
  2. In einer Überschrift steht, dass Mobiltelefone beim Menschen langfristig Krebs verursachen. Wie viele Beweise haben sie dafür?
  3. Für welche Wohltätigkeitsorganisation sollten Sie Geld spenden, wenn Sie möchten, dass es die größte Wirkung erzielt?
  4. Jemand bietet an, eine Münze mit einem Einsatz von 0,90 $ von Ihnen und 1,10 $ von ihnen zu werfen. Würdest du ihnen das Geld geben? Warum Warum nicht?
  5. Sie haben Ihre Schlüssel verloren (oder eine Atombombe). Wo fängst du an zu suchen?

Dies ist auch viel interessanter als das Auswendiglernen der Formel für einen t-Test mit zwei Stichproben: p. Dies erhöht die Wahrscheinlichkeit, dass die Studenten lange genug interessiert bleiben, um sich mit zunehmend technischem Material zu beschäftigen.


3

Niemand hat die Wahrscheinlichkeit erwähnt, die für die Bayes'sche Statistik von grundlegender Bedeutung ist. Ein Argument dafür, Bayes zuerst zu unterrichten, ist, dass der Fluss von Wahrscheinlichkeit zu Wahrscheinlichkeit zu Bayes ziemlich nahtlos ist. Bayes können aufgrund der Wahrscheinlichkeit motiviert werden, indem festgestellt wird, dass (i) die Wahrscheinlichkeitsfunktion wie eine Wahrscheinlichkeitsverteilungsfunktion aussieht (und wirkt), aber nicht, weil die Fläche unter der Kurve nicht 1,0 ist, und (ii) der rohe, häufig verwendete Wald Intervalle nehmen eine Wahrscheinlichkeitsfunktion an, die proportional zu einer Normalverteilung ist, aber die Bayes'schen Methoden überwinden diese Einschränkung leicht.

Ein weiteres Argument für Bayes ist, dass die Bedenken von P (A | B) gegenüber P (B | A) in Bezug auf p-Werte leichter erklärt werden können, wie von anderen erwähnt.

Ein weiteres Argument für "Bayes first" besteht darin, dass die Schüler gezwungen werden, Bedingungswahrscheinlichkeitsmodelle genauer zu betrachten, was an anderer Stelle nützlich ist, z. B. bei der Regressionsanalyse.

Entschuldigen Sie die Eigenwerbung, aber da sie sich ausschließlich auf das Thema bezieht , macht es mir nichts aus, dass dies genau der Ansatz ist, den Keven Henning und ich in unserem Buch "Understanding Advanced Statistical Methods" ( https: // peterwestfall. wixsite.com/book-1 ) deren Zielgruppe Nicht-Statistiker sind.


2

Unterrichten Sie zum Spaß und zur Einsicht oder für den praktischen Gebrauch? Wenn es um Lehren und Verstehen geht, gehe ich zu Bayes. Wenn aus praktischen Gründen, würde ich auf jeden Fall Frequentist gehen.

In vielen Bereichen - und ich nehme an, in den meisten Bereichen - der Naturwissenschaften werden die Arbeiten mit einem p-Wert veröffentlicht. Ihre "Jungs" müssen die Papiere anderer Leute lesen, bevor sie ihre eigenen schreiben können. Um die Arbeiten anderer Leute zu lesen, müssen sie, zumindest in meinem Fachgebiet, Nullhypothesen und p-Werte verstehen, egal wie dumm sie nach Bayes'schen Studien aussehen mögen. Und selbst wenn sie bereit sind, ihre erste Arbeit zu veröffentlichen, werden sie wahrscheinlich einen hochrangigen Wissenschaftler an der Spitze des Teams haben. Wahrscheinlich bevorzugen sie den Frequentismus.

Abgesehen davon stimme ich @Wayne darin zu, dass das statistische Umdenken einen sehr klaren Weg in Richtung Bayes-Statistik als ersten Ansatz zeigt und nicht auf dem vorhandenen Wissen über Frequentismus basiert. Es ist großartig, wie dieses Buch nicht versucht, Sie in einem Kampf um die bessere oder schlechtere Statistik zu überzeugen. Das angegebene Argument des Autors für Bayes ist (IIRC), dass er beide Arten unterrichtet hat und Bayes leichter zu unterrichten war.


2

Ich würde mich von Bayesian fernhalten und den Riesen folgen.

Die Sowjets hatten eine ausgezeichnete Buchreihe für Schüler der Sekundarstufe, die grob als "Quant" -Bibliothek übersetzt wurde. Kolmogorov steuerte ein Buch mit dem Titel "Einführung in eine Wahrscheinlichkeitstheorie" bei. Ich bin mir nicht sicher, ob es jemals ins Englische übersetzt wurde, aber hier ist der Link zu seinem russischen Original.

Sie nähern sich der Erklärung der Wahrscheinlichkeiten durch Kombinatorik, was meiner Meinung nach der beste Weg ist, um anzufangen. Das Buch ist sehr zugänglich für einen Gymnasiasten mit guten Mathematikkenntnissen. Beachten Sie, dass die Sowjets Mathe ziemlich ausführlich unterrichteten, so dass die durchschnittlichen westlichen Gymnasiasten möglicherweise nicht so gut vorbereitet sind, aber meiner Meinung nach mit genügend Interesse und Willenskraft mit dem Inhalt noch umgehen können.

Der Inhalt ist sehr interessant für Schüler, es gibt zufällige Spaziergänge, begrenzte Verteilungen, Überlebensprozesse, Gesetze über große Zahlen usw. Wenn Sie diesen Ansatz mit Computersimulationen kombinieren, wird es noch lustiger.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.