Lassen Sie uns verallgemeinern, um uns auf den Kern der Sache zu konzentrieren. Ich werde die kleinsten Details darlegen, um keine Zweifel zu hinterlassen. Die Analyse erfordert nur Folgendes:
Das arithmetische Mittel einer Menge von Zahlen ist definiert alsz1, … , Zm
1m( z1+ ⋯ + zm) .
Erwartung ist ein linearer Operator. Das heißt, wenn Zufallsvariablen und α i Zahlen sind, dann ist die Erwartung einer linearen Kombination die lineare Kombination der Erwartungen.Zich, i = 1 , ... , mαich
E ( α1Z1+ ⋯ + αmZm) = α1E ( Z1) + ⋯ + αmE ( Zm) .
Sei eine Stichprobe ( B 1 , … , B k ), die aus einem Datensatz x = ( x 1 , … , x n ) erhalten wird, indem k Elemente einheitlich aus x mit Ersetzung genommen werden. Lassen m ( B ) das arithmetische Mittel sein B . Dies ist eine Zufallsvariable. DannB( B1,…,Bk)x=(x1,…,xn)kxm(B)B
E (m(B))= E( 1k(B1+ ⋯ + Bk) ) = 1k( E ( B1) + ⋯ + E ( Bk) )
folgt aus der Linearität der Erwartung. Da die Elemente von alle auf die gleiche Weise erhalten werden, haben sie alle die gleiche Erwartung, b sagen:Bb
E ( B1) = ⋯ = E ( Bk) = b .
Dies vereinfacht das Vorhergehende
E ( m ( B ) ) = 1k( b + b + ⋯ + b ) = 1k( k b ) = b .
Per Definition ist die Erwartung die wahrscheinlichkeitsgewichtete Summe von Werten. Da angenommen wird, dass jeder Wert von die gleiche Chance hat, dass 1 / n ausgewählt wird,X1 / n
E (m(B))=b= E ( B1) = 1nx1+ ⋯ + 1nxn= 1n( x1+ ⋯ + xn) = x¯,
das arithmetische Mittel der Daten.
Zur Beantwortung der Frage, ob man das , um das Populationsmittel zu schätzen, ist das Bootstrap-Mittel (was der Fall ist, k = n ) ebenfalls gleich ˉ x und ist daher identisch mit einem Schätzer des Populationsmittels.x¯k=nx¯
Für Statistiken, die keine linearen Funktionen der Daten sind, gilt nicht unbedingt dasselbe Ergebnis. Es wäre jedoch falsch, einfach das Bootstrap-Mittel für den Statistikwert in den Daten zu ersetzen: So funktioniert Bootstrapping nicht. Stattdessen erhalten wir durch Vergleichen des Bootstrap-Mittels mit der Datenstatistik Informationen über die Abweichung der Statistik. Hiermit kann die ursprüngliche Statistik angepasst werden, um die Abweichung zu beseitigen. Somit wird die vorspannungskorrigierte Schätzung eine algebraische Kombination der ursprünglichen Statistik und des Bootstrap-Mittels. Weitere Informationen finden Sie unter "BCa" (Bias-korrigierter und beschleunigter Bootstrap) und "ABC". Wikipedia bietet einige Referenzen.