Ich lese John Kruschkes Folien "Doing Bayesian Data Analysis" , habe aber tatsächlich eine Frage zu seiner Interpretation von t-Tests und / oder dem gesamten Nullhypothesen-Signifikanztest-Framework. Er argumentiert, dass p-Werte schlecht definiert sind, weil sie von den Absichten des Untersuchers abhängen.
Insbesondere gibt er ein Beispiel (Seite 3-6) für zwei Labore, in denen identische Datensätze erfasst werden, in denen zwei Behandlungen verglichen werden. Ein Labor verpflichtet sich, Daten von 12 Probanden zu sammeln (6 pro Bedingung), während das andere für eine feste Dauer Daten sammelt, was ebenfalls 12 Probanden ergibt. Nach den Dias, die kritische - Wert für p < 0,05 unterscheidet sich zwischen diesen beiden Datenerfassungssysteme: t krit = 2,33 für das ehemalige, aber t krit = 2,45 für das letztere!
Ein Blogbeitrag - den ich jetzt nicht finden kann - schlug vor, dass das Szenario mit fester Dauer mehr Freiheitsgrade hat, da sie Daten von 11, 13 oder einer anderen Anzahl von Probanden hätten sammeln können, während das Szenario mit festem N von Definition hat .
Könnte mir bitte jemand erklären:
Warum würde sich der kritische Wert zwischen diesen Bedingungen unterscheiden?
(Angenommen, es ist ein Problem) Wie würde man die Auswirkungen verschiedener Stoppkriterien korrigieren / vergleichen?
Ich weiß, dass das Einstellen der Stoppkriterien basierend auf der Signifikanz (z. B. Stichprobe bis ) die Wahrscheinlichkeit eines Fehlers vom Typ I erhöhen kann, aber das scheint hier nicht vor sich zu gehen, da keine der Stoppregeln vom Ergebnis von abhängt Die Analyse.