Der offensichtlichste Grund ist, dass die Werte häufig keine zeitliche Abfolge aufweisen. Wenn Sie also die Daten durcheinander bringen, hat dies keinen Einfluss auf die von den Daten übermittelten Informationen. Wenn wir Ihrer Methode folgen, erhalten Sie bei jedem Durcheinander der Daten eine andere Stichprobenvarianz.
Die theoretischere Antwort ist, dass die Stichprobenvarianz die wahre Varianz einer Zufallsvariablen schätzt. Die wahre Varianz einer Zufallsvariablen ist
E [ ( X - E X ) 2 ] .X
E[(X−EX)2].
Hier steht für Erwartung oder "Durchschnittswert". Die Definition der Varianz ist also der durchschnittliche quadratische Abstand zwischen der Variablen und ihrem Durchschnittswert. Wenn Sie sich diese Definition ansehen, gibt es hier keine "Zeitreihenfolge", da es keine Daten gibt. Es ist nur ein Attribut der Zufallsvariablen.E
Wenn Sie ID-Daten von dieser Distribution sammeln, haben Sie Realisierungen . Der beste Weg, die Erwartung abzuschätzen, besteht darin, die Durchschnittswerte der Stichprobe zu ermitteln. Der Schlüssel hier ist, dass wir ID-Daten haben und daher keine Reihenfolge zu den Daten besteht. Die Stichprobe x 1 , x 2 , ... , x n ist dieselbe wie die Stichprobe x 2 , x 5 , x 1 , x n . .x1,x2,…,xnx1,x2,…,xnx2, x5, x1, xn. .
BEARBEITEN
Die Stichprobenvarianz misst eine bestimmte Art von Streuung für die Stichprobe, die den durchschnittlichen Abstand vom Mittelwert misst. Es gibt andere Arten der Streuung wie Datenbereich und Inter-Quantile-Bereich.
Auch wenn Sie Ihre Werte in aufsteigender Reihenfolge sortieren, ändert dies nichts an den Eigenschaften der Stichprobe. Die Probe (Daten), die Sie erhalten, sind Realisierungen aus einer Variablen. Die Berechnung der Stichprobenvarianz ist vergleichbar mit dem Verständnis der Streuung in der Variablen. Wenn Sie zum Beispiel 20 Personen befragen und deren Größe berechnen, dann sind dies 20 "Realisierungen" aus der Zufallsvariablen Größe der Personen. Die Stichprobenvarianz soll nun allgemein die Variabilität der Körpergröße von Individuen messen. Wenn Sie die Daten 100 , 110 , 123 , 124 , ... bestellen
,X=
100 , 110 , 123 , 124 , … ,
Dies ändert nichts an den Informationen im Beispiel.
Schauen wir uns noch ein Beispiel an. Nehmen wir an, Sie haben 100 Beobachtungen aus einer Zufallsvariablen, die auf diese Weise nach 1 , 2 , 3 , 4 , 5 , 6 , 7 , 8 , 9 , 10 geordnet wurden Dann beträgt die durchschnittliche Folgeentfernung 1 Einheiten. Nach Ihrer Methode beträgt die Varianz 1.
1,2,3,4,5,6,7,8,9,10,11,12,13,14,...100.
Die Interpretation von "Varianz" oder "Streuung" besteht darin, zu verstehen, welcher Wertebereich für die Daten wahrscheinlich ist. In diesem Fall erhalten Sie eine Reichweite von 0,99 Einheiten, was natürlich die Variation nicht gut darstellt.
Wenn Sie anstelle des Durchschnitts nur die nachfolgenden Differenzen summieren, beträgt Ihre Varianz 99. Dies stellt natürlich nicht die Variabilität in der Stichprobe dar, da 99 Ihnen den Bereich der Daten und kein Gefühl der Variabilität gibt.