Gesamtfehler Typ I beim wiederholten Testen akkumulierender Daten


12

Ich habe eine Frage zu gruppensequenziellen Methoden .

Laut Wikipedia:

In einer randomisierten Studie mit zwei Behandlungsgruppen werden klassische Gruppensequenztests auf folgende Weise durchgeführt: Stehen n Probanden in jeder Gruppe zur Verfügung, wird eine Zwischenanalyse der 2n Probanden durchgeführt. Die statistische Analyse wird durchgeführt, um die beiden Gruppen zu vergleichen, und wenn die alternative Hypothese akzeptiert wird, wird der Versuch abgebrochen. Andernfalls wird die Studie für weitere 2n Probanden mit n Probanden pro Gruppe fortgesetzt. Die statistische Analyse wird erneut an den 4n-Probanden durchgeführt. Wenn die Alternative akzeptiert wird, wird der Versuch abgebrochen. Andernfalls wird mit regelmäßigen Auswertungen fortgefahren, bis N Sätze von 2n Probanden verfügbar sind. Zu diesem Zeitpunkt wird der letzte statistische Test durchgeführt und der Versuch abgebrochen

Durch wiederholtes Testen akkumulierender Daten auf diese Weise wird die Fehlerstufe von Typ I aufgebläht ...

Wenn die Abtastwerte voneinander unabhängig wären , wäre der Gesamtfehler Typ I α

α=1-(1-α)k

Dabei ist der Pegel jedes Tests und k die Anzahl der Zwischenprüfungen.αk

Die Stichproben sind jedoch nicht unabhängig, da sie sich überlappen. Unter der Annahme, dass Zwischenanalysen in gleichen Informationsschritten durchgeführt werden, kann festgestellt werden, dass (Folie 6)

Bildbeschreibung hier eingeben

Können Sie mir erklären, wie diese Tabelle erhalten wird?

Antworten:


12

Die folgenden Folien (bis 14) erläutern die Idee. Wie Sie bemerken, ist der Punkt, dass die Reihenfolge der Statistiken korreliert ist.

z1Φz21/2(z1,z2)c=Φ-1(1-0,05/2)α|z1|>c|z1|c|z2|>c

Diese Grafik zeigt das binormale PDF und den Integrationsbereich (feste Oberfläche). Binormales PDF, 3D-Oberflächendiagramm


Verstanden. Danke! Ist die Korrelation cor (z1, z2) schwer zu erhalten?
2.

z1z1-z2. In komplizierteren Fällen kann die Korrelation sehr schwer zu berechnen sein: Dies ist ein Grund, warum diese etwas idealisierte Situation verwendet wird, um die sequentiellen Tests zu motivieren!
whuber

Vielen Dank. Ja, die Korrelation scheint ziemlich einfach zu berechnen zu sein. Eigentlich war mir nicht klar, dass der Kontext ein Vergleich der Mittel zweier Normalverteilungen war. Jetzt ist es klar und Sie machen auch alles andere sehr klar! Vielen Dank!
2.

Können Sie eine Formel (oder einen R-Code) angeben, wie dies berechnet werden soll, z. B. für n = 400? Ich würde das alleine machen, aber ich weiß leider nicht wie. Und wie müsste ich die Formel anpassen, wenn ich die Gesamtfehlerrate berechnen möchte, wenn ich mehrere Vergleiche (z. B. Vergleich von 4 Anteilen) habe und keine Korrektur wie bei Bonferroni und wiederholte Tests mache? Könntest du mir dabei helfen?
Andreas
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.