Sie sagen nicht, was das andere Statistikbuch ist, aber ich würde vermuten, dass es sich um ein Buch (oder einen Abschnitt) über endliche Bevölkerungsstichproben handelt .
Wenn Sie Zufallsvariablen abtasten, dh wenn Sie eine Menge von
von Zufallsvariablen betrachten, wissen Sie, dass wenn sie unabhängig sind, und gleichverteilt , insbesondere und für alle , dann:
wobei die zweite ist zentraler Moment. n f ( x 1 , … , x n ) = f ( x 1 ) ≤ f ( x n ) E ( X i ) = μ Var ( X i ) = σ 2 i ≤ X = ≤ i X iX1, … , Xnnf( x1, … , Xn) = f( x1) ⋯ f( xn)E( Xich) = μVar ( Xich) = σ2ich σ2
X¯¯¯¯= ∑ichXichn,E( X¯¯¯¯) = μ ,Var ( X¯¯¯¯) = σ2n
σ2
Die Auswahl einer endlichen Population ist etwas anders. Wenn die Population die Größe , gibt es bei der ersatzlosen Stichprobe mögliche Stichproben der Größe und sie sind gleich wahrscheinlich:
Wenn beispielsweise und , ist der Probenraum
und die möglichen Beispiele sind:
N sinp(si)=1( Nn)sichn N=5n=3{s1,...,s10} s 1 ={1,2,3}, s 2 ={1,2,4}, s 3 ={1,2,5}, s 4 ={1,3,4},
p ( sich) = 1( Nn)∀ i = 1 , … , ( Nn)
N= 5n = 3{ s1, … , S10} siE[X]n=Ns1= { 1 , 2 , 3 } , s2= { 1 , 2 , 4 } , s3= { 1 , 2 , 5 } , s4= { 1 , 3 , 4 } , s5= { 1 , 3 , 5 } ,s6= { 1 , 4 , 5 } , s7= { 2 , 3 , 4 } , s8= { 2 , 3 , 5 } , s9= { 2 , 4 , 5 } , s10= { 3 , 4 , 5 }
Wenn Sie die Anzahl der Vorkommen jedes Individuums zählen, sehen Sie, dass es sich um sechs handelt, dh, jedes Individuum hat die gleiche Chance, ausgewählt zu werden (6/10). Jedes ist also eine Zufallsstichprobe nach der zweiten Definition. Grob gesagt handelt es sich nicht um eine zufällige Stichprobe, da Einzelpersonen keine zufälligen Variablen sind: Sie können durch einen Stichprobenmittelwert konsistent abschätzen , kennen aber nie seinen genauen Wert, aber Sie
können den genauen Populationsmittelwert kennen, wenn (let Ich wiederhole: ungefähr.)
sichE[ X]n = N1
Sei ein Polulationsmittel (mittlere Größe, mittleres Einkommen, ...). Wenn
, können Sie wie bei Stichproben mit zufälligen Variablen schätzen :
aber die Stichprobe Die mittlere Varianz ist unterschiedlich:
wobei ist die Populationsquasivarianz:
. Der Faktor wird üblicherweise als " endlicher Populationskorrekturfaktor " bezeichnet.n < N μ ¯ y s = n Σ i = 1 y i ,μn < NμVar ( ¯ y s ) = ~ σ 2
y¯¯¯s= ∑i = 1nyich,E( y¯¯¯s) = μ
Var ( y¯¯¯s) = σ~2n( 1 - nN)
σ~2∑Ni = 1( yich- y¯¯¯)2N- 1( 1 - n / n)
Dies ist ein kurzes Beispiel dafür, wie sich eine Zufallsstichprobe (Zufallsvariable) und eine Zufallsstichprobe (endliche Population) unterscheiden können. Bei der statistischen Inferenz geht es hauptsächlich um Stichproben mit Zufallsvariablen, bei der Stichproben-Theorie um Stichproben mit endlicher Bevölkerungszahl.
1 Angenommen, Sie stellen Glühbirnen her und möchten deren durchschnittliche Lebensdauer kennen. Ihre "Bevölkerung" ist nur theoretisch oder virtuell, zumindest wenn Sie weiterhin Glühbirnen herstellen. Sie müssen also einen Datenerzeugungsprozess modellierenund interpretieren Sie einen Satz von Glühbirnen als (zufällige variable) Stichprobe. Sagen Sie jetzt, dass Sie eine Schachtel mit 1000 Glühbirnen finden und deren durchschnittliche Lebensdauer erfahren möchten. Sie können einen kleinen Satz von Glühbirnen auswählen (eine Stichprobe mit endlichen Populationen), aber Sie können auch alle auswählen. Wenn Sie eine kleine Stichprobe auswählen, werden Glühbirnen nicht in Zufallsvariablen umgewandelt. Die Zufallsvariable wird von Ihnen generiert, da Sie die Wahl zwischen "Alle" und "Kleine Menge" treffen können. Wenn jedoch eine endliche Bevölkerung sehr groß ist (sagen Sie, Ihre Landbevölkerung), ist die Auswahl von "alle" nicht realisierbar, und die zweite Situation ist besser als die erste zu handhaben.