Ich habe zwei stark verzerrte Stichproben und versuche, mithilfe von Bootstrapping ihre Mittelwerte mithilfe der t-Statistik zu vergleichen.
Wie ist die richtige Vorgehensweise dafür?
Der Prozess, den ich benutze
Ich bin besorgt über die Angemessenheit der Verwendung des Standardfehlers der ursprünglichen / beobachteten Daten im letzten Schritt, wenn ich weiß, dass dies nicht normal verteilt ist.
Hier sind meine Schritte:
- Bootstrap - Zufallsstichprobe mit Ersatz (N = 1000)
- Berechnen Sie die t-Statistik für jeden Bootstrap, um eine t-Verteilung zu erstellen:
- Schätzen Sie die t-Konfidenzintervalle, indem Sie und Perzentile der t-Verteilung erhalten1 - α / 2
Erhalten Sie Konfidenzintervalle über:
C I U = ( ¯ X 1 - ¯ X 2 ) + T _ C I U . S E o r i g i n a l
wobei- Prüfen Sie, wo die Konfidenzintervalle liegen, um festzustellen, ob ein signifikanter Mittelwertunterschied vorliegt (dh nicht Null).
Ich habe mir auch die Wilcoxon-Rang-Summe angesehen, aber sie liefert aufgrund der sehr stark verzerrten Verteilung (z. B. das 75. == 95. Perzentil) keine sehr vernünftigen Ergebnisse. Aus diesem Grund möchte ich den Bootstrapped-T-Test weiter untersuchen.
Meine Fragen sind also:
- Ist das eine angemessene Methodik?
- Ist es angemessen, die SE der beobachteten Daten zu verwenden, wenn ich weiß, dass sie stark verzerrt sind?
Mögliches Duplikat: Welche Methode wird bevorzugt, ein Bootstrapping-Test oder ein nichtparametrischer rangbasierter Test?