Ich folge Ihrer Richtlinie: "Suche nach einer Antwort aus glaubwürdigen und / oder offiziellen Quellen."
Der Bootstrap wurde von Brad Efron erfunden. Ich denke, es ist fair zu sagen, dass er ein angesehener Statistiker ist. Tatsache ist, dass er Professor an der Stanford University ist. Ich denke, das macht seine Ansichten glaubwürdig und offiziell.
Ich glaube, dass Computer Age Statistical Inference von Efron und Hastie sein neuestes Buch ist und daher seine aktuellen Ansichten widerspiegeln sollte. Ab p. 204 (11.7, Notizen und Details),
Die Bootstrap-Konfidenzintervalle sind weder genau noch optimal, sondern zielen auf eine breite Anwendbarkeit bei nahezu genauer Genauigkeit ab.
Wenn Sie Kapitel 11, "Bootstrap-Konfidenzintervalle" lesen, werden vier Methoden zum Erstellen von Bootstrap-Konfidenzintervallen beschrieben. Die zweite dieser Methoden ist (11.2) Die Perzentilmethode. Die dritte und die vierte Methode sind Varianten der Perzentilmethode, die versuchen, das zu korrigieren, was Efron und Hastie als Verzerrung im Konfidenzintervall beschreiben und für die sie eine theoretische Erklärung geben.
Abgesehen davon kann ich nicht entscheiden, ob es einen Unterschied zwischen dem, was die MIT-Leute empirisches Bootstrap-CI und Perzentil-CI nennen, gibt. Ich mag einen Hirnfurz haben, aber ich sehe die empirische Methode als die Perzentilmethode, nachdem ich eine feste Menge abgezogen habe. Daran sollte sich nichts ändern. Wahrscheinlich lese ich falsch, aber ich wäre sehr dankbar, wenn jemand erklären könnte, warum ich ihren Text falsch verstehe.
Unabhängig davon scheint die führende Behörde kein Problem mit Perzentil-CIs zu haben. Ich denke auch, dass sein Kommentar Kritik an Bootstrap CI beantwortet, die von einigen Leuten erwähnt wird.
MAJOR ADD ON
Erstens, nachdem Sie sich die Zeit genommen haben, das MIT-Kapitel und die Kommentare zu lesen, ist das Wichtigste zu beachten, dass das, was das MIT als empirischen Bootstrap und als Perzentil-Bootstrap bezeichnet, sich darin unterscheiden wird, was sie als empirisch bezeichnen Der Bootstrap ist das Intervall während der Perzentil-Bootstrap das Konfidenzintervall .
Ich würde weiter argumentieren, dass gemäß Efron-Hastie der Perzentil-Bootstrap kanonischer ist. Der Schlüssel zu dem, was MIT den empirischen Bootstrap nennt, ist die Betrachtung der Verteilung von . Aber warum , warum nicht[ x ∗¯- δ.1, x ∗¯- δ.9][ x ∗¯- δ.9, x ∗¯- δ.1]
δ= x¯- μx¯- μμ - x¯ . Genauso vernünftig. Außerdem ist das Delta für den zweiten Satz der verunreinigte Perzentil - Bootstrap! Efron verwendet das Perzentil und ich denke, dass die Verteilung der tatsächlichen Mittel am grundlegendsten sein sollte. Ich möchte hinzufügen, dass Efron zusätzlich zu Efron und Hastie und dem 1979 in einer anderen Antwort erwähnten Papier von Efron 1982 ein Buch über den Bootstrap schrieb. In allen drei Quellen wird der Perzentil-Bootstrap erwähnt, aber ich finde keine Erwähnung dessen, was Die MIT-Leute nennen das empirische Bootstrap. Außerdem bin ich mir ziemlich sicher, dass sie den Perzentil-Bootstrap falsch berechnen. Unten ist ein R-Notizbuch, das ich geschrieben habe.
Anmerkungen zur MIT-Referenz Lassen Sie uns zuerst die MIT-Daten in R übernehmen. Ich habe einen einfachen Job zum Ausschneiden und Einfügen der Bootstrap-Beispiele ausgeführt und in der Datei boot.txt gespeichert.
Hide orig.boot = c (30, 37, 36, 43, 42, 43, 43, 46, 41, 42) boot = read.table (file = "boot.txt") bedeutet = as.numeric (lapply (boot , mean)) # lapply erstellt Listen, keine Vektoren. Ich benutze es IMMER für Datenrahmen. mu = mean (orig.boot) del = sort (means - mu) # Die Unterschiede mu bedeuten del und weiter
Mu - sort (del) ausblenden [3] mu - sort (del) [18] Wir erhalten also die gleiche Antwort, die sie geben. Insbesondere habe ich das gleiche 10. und 90. Perzentil. Ich möchte darauf hinweisen, dass der Bereich vom 10. bis zum 90. Perzentil 3 beträgt. Dies ist derselbe, den das MIT hat.
Was sind meine Mittel?
Verstecken bedeutet sortieren (bedeutet) Ich bekomme verschiedene Mittel. Wichtiger Punkt - mein 10. und 90. bedeuten 38,9 und 41,9. Das würde ich erwarten. Sie unterscheiden sich, weil ich Entfernungen von 40,3 berücksichtige und daher die Subtraktionsreihenfolge umdrehe. Beachten Sie, dass 40,3-38,9 = 1,4 (und 40,3 - 1,6 = 38,7). Das, was sie als Perzentil-Bootstrap bezeichnen, ergibt eine Verteilung, die von den tatsächlichen Mitteln abhängt, die wir erhalten, und nicht von den Unterschieden.
Schlüsselpunkt Der empirische Bootstrap und der Perzentil-Bootstrap unterscheiden sich darin, dass das, was sie den empirischen Bootstrap nennen, das Intervall [x ∗ ¯ − δ.1, x ∗ ¯ − δ.9] [x ∗ ¯ − δ.1, x ∗ ¯ − δ.9], während der Perzentil-Bootstrap das Konfidenzintervall [x ∗ ¯ − δ.9, x ∗ ¯ − δ.1] [x ∗ ¯ − δ.9, x ∗ ¯ − δ.1 hat ]. Normalerweise sollten sie nicht so unterschiedlich sein. Ich habe meine Gedanken, welche ich bevorzugen würde, aber ich bin nicht die endgültige Quelle, die OP anfordert. Gedankenexperiment - sollten die beiden konvergieren, wenn die Stichprobengröße zunimmt. Beachten Sie, dass es 210210 mögliche Proben der Größe 10 gibt. Lassen Sie uns nicht verrückt werden, aber was ist, wenn wir 2000 Proben nehmen - eine Größe, die normalerweise als ausreichend angesehen wird.
Verstecke set.seed (1234) # reproduzierbar boot.2k = matrix (NA, 10,2000) für (i in c (1: 2000)) {boot.2k [, i] = sample (orig.boot, 10, replace = T)} mu2k = sort (apply (boot.2k, 2, mean)) Schauen wir uns mu2k an
Zusammenfassung ausblenden (mu2k) Mittelwert (mu2k) -mu2k [200] Mittelwert (mu2k) - mu2k [1801] und die tatsächlichen Werte-
Verstecke mu2k [200] mu2k [1801] Also ergibt das, was MIT den empirischen Bootstrap nennt, ein 80% -Konfidenzintervall von [, 40,3 -1,87,40,3 +1,64] oder [38,43,41,94] und die schlechte Perzentilverteilung ergibt [38,5, 42]. Dies ist natürlich sinnvoll, da das Gesetz der großen Zahlen in diesem Fall vorschreibt, dass die Verteilung zu einer Normalverteilung konvergieren soll. Dies wird übrigens in Efron und Hastie diskutiert. Die erste Methode zur Berechnung des Bootstrap-Intervalls ist mu = / - 1,96 sd. Wie bereits erwähnt, funktioniert dies bei einer ausreichend großen Stichprobe. Sie geben dann ein Beispiel an, für das n = 2000 nicht groß genug ist, um eine annähernd normale Verteilung der Daten zu erhalten.
Schlussfolgerungen Zunächst möchte ich das Prinzip darlegen, nach dem ich bei der Entscheidung über Namensfragen vorgehe. "Es ist meine Party, die ich weinen kann, wenn ich will." Obwohl Petula Clark sie ursprünglich aussprach, denke ich, dass sie auch Namensstrukturen anwendet. Mit aufrichtiger Ehrerbietung gegenüber MIT denke ich, dass Bradley Efron es verdient, die verschiedenen Bootstrapping-Methoden so zu benennen, wie er es wünscht. Was macht er ? Ich kann in Efron keine Erwähnung von 'empirischem Bootstrap' finden, nur Perzentil. Also werde ich Rice, MIT, et al. Demütig widersprechen. Ich möchte auch darauf hinweisen, dass nach dem Gesetz der großen Zahlen, wie es in der MIT-Vorlesung verwendet wird, empirisch und Perzentil zur gleichen Zahl konvergieren sollten. Nach meinem Geschmack ist Perzentil-Bootstrap intuitiv, gerechtfertigt und das, was der Erfinder von Bootstrap im Sinn hatte. Ich würde hinzufügen, dass ich mir die Zeit genommen habe, dies nur für meine eigene Erbauung zu tun, nicht für irgendetwas anderes. Bestimmtes, Ich habe Efron nicht geschrieben, was OP wahrscheinlich tun sollte. Am liebsten stehe ich korrigiert da.