Angenommen, ich habe zwei Bedingungen und meine Stichprobengröße für die beiden Bedingungen ist extrem niedrig. Nehmen wir an, ich habe nur 14 Beobachtungen in der ersten Bedingung und 11 in der anderen. Ich möchte den t-Test verwenden, um zu testen, ob sich die mittleren Unterschiede signifikant voneinander unterscheiden.
Erstens bin ich ein wenig verwirrt über die Normalitätsannahme des T-Tests, weshalb ich möglicherweise nicht vollständig Bootstrapping bekomme. Ist die Annahme für den t-Test, dass (A) die Daten aus einer normalen Population entnommen wurden oder (B) dass Ihre Stichprobenverteilungen Gaußsche Eigenschaften haben? Wenn es (B) ist, dann ist es nicht wirklich eine Annahme, oder? Sie können einfach ein Histogramm Ihrer Daten zeichnen und sehen, ob es normal ist oder nicht. Wenn meine Stichprobengröße jedoch niedrig ist, habe ich nicht genügend Datenpunkte, um festzustellen, ob meine Stichprobenverteilung normal ist.
Hier kommt meiner Meinung nach das Bootstrapping ins Spiel. Ich kann das Bootstrap durchführen, um zu sehen, ob mein Beispiel normal ist, oder? Zuerst dachte ich, dass Bootstrapping immer zu einer Normalverteilung führen würde, aber das ist nicht der Fall ( Kann Bootstrap-Resampling verwendet werden, um ein Konfidenzintervall für die Varianz eines Datensatzes zu berechnen ? Statexchange statexchange ). Ein Grund, warum Sie booten würden, ist, sich der Normalität Ihrer Beispieldaten sicherer zu sein, richtig?
An diesem Punkt werde ich jedoch gründlich verwirrt. Wenn ich einen t-Test in R mit der Funktion t.test durchführe und die Bootstrap-Abtastvektoren als die beiden unabhängigen Abtastwerte einsetze, wird mein t-Wert einfach wahnsinnig signifikant. Mache ich den Bootstrap-T-Test nicht richtig? Ich darf nicht, weil alles, was Bootstrapping macht, nur meinen t-Wert vergrößert, würde das nicht in jedem Fall passieren? Führen die Leute keinen T-Test für die Bootstrap-Samples durch?
Was ist der Vorteil der Berechnung von Konfidenzintervallen auf einem Bootstrap gegenüber der Berechnung von Konfidenzintervallen in unserer Originalstichprobe? Was sagen mir diese Konfidenzintervalle, dass Konfidenzintervalle für die ursprünglichen Probendaten dies nicht tun?
Ich glaube, ich bin verwirrt darüber, (A) warum ein Bootstrap verwendet werden soll, wenn dadurch nur mein t-Wert signifikanter wird, (B) nicht sicher ist, wie Bootstrapping bei der Durchführung eines unabhängigen Beispiel-T-Tests richtig eingesetzt werden soll, und (C) unsicher wie die Rechtfertigung, Ausführung und Ergebnisse von Bootstrapping in unabhängigen T-Test-Situationen gemeldet werden.