Ich habe mich gefragt, wie Bootstrap-CIs (und insbesondere BCa) bei normal verteilten Daten funktionieren. Es scheint eine Menge Arbeit zu geben, um ihre Leistung bei verschiedenen Arten von Verteilungen zu untersuchen, aber bei normal verteilten Daten konnte nichts gefunden werden. Da es naheliegend erscheint, zuerst zu lernen, sind die Papiere wohl einfach zu alt.
Ich habe einige Monte-Carlo-Simulationen mit dem R-Boot-Paket durchgeführt und festgestellt, dass die Bootstrap-CIs mit den exakten CIs übereinstimmen, obwohl sie für kleine Stichproben (N <20) tendenziell etwas liberal sind (kleinere CIs). Für ausreichend große Proben sind sie im Wesentlichen gleich.
Ich frage mich daher, ob es einen guten Grund gibt, nicht immer Bootstrapping zu verwenden. Angesichts der Schwierigkeit, zu beurteilen, ob eine Verteilung normal ist, und der vielen Tücken dahinter, erscheint es vernünftig, Bootstrap-CIs unabhängig von der Verteilung nicht zu entscheiden und zu melden. Ich verstehe die Motivation, nicht-parametrische Tests nicht systematisch zu verwenden, da sie weniger Leistung haben, aber meine Simulationen zeigen, dass dies bei Bootstrap-CIs nicht der Fall ist. Sie sind noch kleiner.
Eine ähnliche Frage, die mich stört, ist, warum man nicht immer den Median als Maß für die zentrale Tendenz verwendet. Es wird häufig empfohlen, nicht normalverteilte Daten damit zu charakterisieren. Da der Median jedoch mit dem Mittelwert für normalverteilte Daten identisch ist, warum dann eine Unterscheidung treffen? Es wäre sehr vorteilhaft, wenn wir die Prozeduren für die Entscheidung, ob eine Verteilung normal ist oder nicht, loswerden könnten.
Ich bin sehr gespannt auf Ihre Gedanken zu diesen Themen und darauf, ob sie bereits diskutiert wurden. Referenzen würden sehr geschätzt.
Vielen Dank!
Pierre