Ich habe gerade einen Vortrag über statistische Inferenz ("Vergleichen von Proportionen und Mitteln") gesehen, der Teil eines Online-Kurses zur Einführung in die Statistik ist. Das Material ergab für mich so wenig Sinn wie immer (inzwischen muss ich dieses Zeug Dutzende Male gesehen haben, verteilt über die letzten drei Jahrzehnte).
Ich suche ein Buch über "Basic Stats-101" (Punktschätzung, Schätzungsbewertung, statistische Inferenz, Hypothesentest, Studiendesign), das das Problem ernst nimmt, einen skeptischen Leser zu überzeugen ...
Im Folgenden gebe ich einige Beispiele für die Art der Frage, die der von mir gesuchte Autor ernst nehmen und überzeugend beantworten kann.
Aber lassen Sie mich zunächst kurz betonen, dass ich in diesem Beitrag diese Fragen nicht stelle. Bitte antworten Sie nicht! Ich gebe sie nur als Beispiele und als "Lackmus-Test" (für die Art des Autors der Suche).
Wenn ein "Anteil" einfach der Mittelwert einer booleschen Variablen ist (dh eine, die nur die Werte 0 und 1 annimmt), warum werden unterschiedliche Verfahren für die statistische Folgerung mit "Anteilen" und mit "Mitteln" gelehrt?
Wenn die Normalverteilung so robust ist, dass die Annahme von Normalität auch in Fällen, in denen diese Daten nicht ganz normal verteilt sind, gute Ergebnisse liefert, und wenn die t-Verteilung so normal aussieht, warum dann so viel Aufhebens um die Verwendung der t-Verteilung anstelle der normal?
Was genau sind "Freiheitsgrade" und warum sorgen wir uns um sie?
Was bedeutet es, vom "wahren" Wert eines Parameters zu sprechen, wenn man bedenkt, dass wir nur Verteilungen verwenden, die zufällig ähnlich wie die Daten aussehen ?
Wie kommt es, dass "explorative Datenanalyse" eine gute Sache ist, während "Datenschnüffeln" eine böse Sache ist?
Wie ich schon sagte, bin ich von der Haltung , die eine Vernachlässigung solcher Fragen impliziert , abgeschreckt . Es ist nicht die "erkenntnistheoretische Haltung", die ich in jemandem sehen möchte, der mir etwas beibringt. Ich suche Autoren, die die Skepsis und Rationalität des Lesers respektieren und wissen, wie man sie anspricht (ohne unbedingt auf Seiten und Seiten mit Formalismen und technischen Aspekten zu gehen).
Mir ist klar, dass dies eine große Herausforderung ist, und vielleicht besonders, wenn es um Statistiken geht. Daher erwarte ich nicht, dass es vielen Autoren gelungen sein wird. Aber im Moment würde ich mich damit zufrieden geben, nur einen zu finden .
Lassen Sie mich hinzufügen, dass ich nicht mathematisch abgeneigt bin. Im Gegenteil, ich liebe Mathe. (Ich bin vertraut mit Analysis, linearer Algebra, Wahrscheinlichkeitstheorie und sogar grundlegender Maßtheorie.)
Das heißt, ich interessiere mich im Moment für "angewandte", "praktische", "alltägliche" und "reale" Statistiken (im Gegensatz zu theoretischen Feinheiten). (Aber ich will auch kein Kochbuch!)
FWIW, ich habe die ersten Kapitel der Datenanalyse mit Regression und mehrstufigen / hierarchischen Modellen von Gelman und Hill gelesen , und ich mag den Ton der Autoren. Sie konzentrieren sich auf die Praxis, gehen aber bei Bedarf auf die Theorie ein. Sie treten auch häufig zurück und bewerten Standardpraktiken kritisch und bieten aufrichtige Meinungen, die den gesunden Menschenverstand eines skeptischen Lesers ansprechen. Leider haben diese Autoren kein Buch geschrieben, das sich mit dem Thema befasst, nach dem ich in diesem Beitrag frage ("Stats 101", wie oben beschrieben). Mir ist auch bekannt, dass einer dieser Autoren (Gelman) die hoch angesehene Bayes'sche Datenanalyse mitautorisiert hat , aber auch dies ist im Moment nicht das, wonach ich suche.
BEARBEITEN:
Dikran Beuteltier erhebt folgenden Einwand:
Ich glaube nicht, dass es notwendig ist, Fragen zu vernachlässigen. Es kommt ein Punkt, an dem die Beantwortung jeder Frage die Darstellung der Grundbegriffe beeinträchtigt, was oft wichtiger ist (insbesondere in einem Statistikbuch!).
Ich stimme dem zu. Ich würde genauer sagen, dass ich nach einem "zweiten Blick auf die grundlegenden Statistiken" suche. Aus diesem Grund habe ich mir die Lehrbücher angeschaut, die in Abschlusskursen zum Thema Inferenz (etwa) verwendet wurden, und festgestellt, dass sie auch Fragen vernachlässigten, wie die, die ich aufgelistet habe. Wenn überhaupt, schienen sie noch weniger geneigt zu sein, sich mit solchen Fragen zu befassen (so dass sie sich auf Dinge konzentrieren können, wie die Bedingungen für eine Konvergenz-oder-andere von diesem oder jenem ...).
Das Problem ist, dass die fortgeschritteneren Bücher an eine radikal andere Leserschaft gerichtet sind, eine, bei der die "Skepsis des Außenseiters" drastisch nachgelassen hat. IOW, diejenigen, die Absolventenstatistiken erstellen, werden von den Fragen, die mich beschäftigen, nicht mehr gestört. Sie sind nicht mehr skeptisch gegenüber all diesen Dingen. (Wie sind sie über den Skepsis-Buckel hinweggekommen? Vielleicht waren einige von ihnen überhaupt nie zu kritisch, besonders wenn sie ihre Statistiken relativ früh gelernt haben - ich weiß, dass ich selbst kein besonders kritischer Neuling war, obwohl ich es nicht getan habe Nehmen Sie dann Statistiken. Andere haben vielleicht Lehrer, die ihre Lehrbücher ausgefüllt haben. Einige waren vielleicht klug genug, um die Antworten auf solche Fragen selbst herauszufinden. Wer weiß.)