Warum wird in der Standardabweichungsformel eine Quadratwurzel für die Stichprobenanzahl „N“ gezogen?


9

Ich versuche ein sehr grundlegendes Konzept der Standardabweichung zu verstehen.

Aus der Formelσ=i=1n(xiμ)2N

Ich kann nicht verstehen, warum wir die Population "N" halbieren sollten, dh warum wollen wir wenn wir {N ^ 2} nicht gemacht haben ? Verzerrt das nicht die Bevölkerung, die wir in Betracht ziehen? N 2NN2

Sollte nicht die Formel sein σ=i=1n(xiμ)2N

Antworten:


10

Sie versuchen, eine "typische" Abweichung vom Mittelwert zu finden.

Die Varianz ist "der durchschnittliche quadratische Abstand vom Mittelwert".

Die Standardabweichung ist die Quadratwurzel davon.

Das macht es zur quadratischen Abweichung vom Mittelwert.

  1. Warum sollten wir die durchschnittliche quadratische Abweichung verwenden? Was macht Varianz interessant? Unter anderem aufgrund einer grundlegenden Tatsache über Varianzen - dass die Varianz einer Summe nicht korrelierter Variablen die Summe der einzelnen Varianzen ist. (Dies wird in einer Reihe von Fragen behandelt, z . B. hier bei CrossValidated. Diese praktische Funktion wird beispielsweise nicht durch die mittlere absolute Abweichung geteilt.
  2. Warum die Quadratwurzel daraus ziehen? Denn dann ist es in den gleichen Einheiten wie die ursprünglichen Beobachtungen. Es misst eine bestimmte Art von "typischer Entfernung" vom Mittelwert (wie erwähnt, die RMS-Entfernung) - aber aufgrund der obigen Eigenschaft der Varianz - eine, die einige nette Merkmale aufweist.

7

Die Standardabweichung ist die Quadratwurzel der Varianz .

Die Varianz ist der durchschnittliche quadratische Abstand der Daten vom Mittelwert. Da ein Durchschnitt die Summe geteilt durch die Anzahl der summierten Elemente ist, lautet die Formel für die Varianz: Da die Standardabweichung wiederum einfach die Quadratwurzel davon ist, lautet die Formel für die Standardabweichung: nichts hinzugefügt oder geändert die Annahmen oder die Varianz hier haben wir einfach die Quadratwurzel der Varianz, denn das ist , was die Standardabweichung ist .
S.D. (X)=

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

S.D.(X)=Var(X)=i=1N(xiμ)2N

Vielleicht sollte erwähnt werden, dass diese Varianzformel nur für diskrete Uniformen gilt. Andernfalls könnte die Unterscheidung zwischen Stichproben- und Populationsvarianz verwechselt werden
Taylor,

@ Taylor, ich weiß nicht was du meinst. Die Formel für die Varianz hängt nicht mit der Verteilung zusammen.
Gung - Reinstate Monica

Die Formel für (Stichproben-) Varianz hängt nicht mit der Verteilung zusammen ( en.wikipedia.org/wiki/Expected_value#Definition )
Taylor,

@ Taylor, ich weiß immer noch nicht was du meinst. Die Formel für die Varianz hängt nicht mit der Verteilung zusammen. Um auf der Wikipedia-Seite zu zitieren: "Die Varianz einer Zufallsvariablen X ist der erwartete Wert der quadratischen Abweichung vom Mittelwert von X ... . Diese Definition umfasst Zufallsvariablen, die durch Prozesse erzeugt werden, die diskret, kontinuierlich, weder noch gemischt sind. " Die Formel gilt nicht nur für die diskrete Uniform. Var(X)=E[(Xμ)2]
Gung - Reinstate Monica

Ja, das ist richtig, wenn Sie nehmen , aber nicht notwendigerweise gleich, für jede Zufallsvariable , . Zum einen ist die erste eine Konstante und die zweite ist zufällig. Eigentlich ist nicht klar, ob die Summe über die Unterstützung von oder die Anzahl der Samples läuft . Wenn letzteres der Fall ist, ist es seltsam, dass Sie , was in der Praxis selten vorkommt. Wenn erstere, dann ja, gilt dies nur für diskrete (weil es eine Summe ist) Uniformen (weil die Gewichte alle einheitlich sind). μ=EXE[(Xμ)2]X X μ1Ni(xiμ)2Xμ
Taylor

1

Als erstes ist zu verstehen, dass sich die Standardabweichung (std) von der durchschnittlichen absoluten Abweichung unterscheidet . Diese beiden definieren unterschiedliche mathematische Eigenschaften der Daten.

Im Gegensatz zur durchschnittlichen absoluten Abweichung wiegt die Standardabweichung (std) mehr als die Werte, die weit vom Mittelwert entfernt sind. Dies erfolgt durch Quadrieren der Differenzwerte.

Beispiel: Für die folgenden vier Datenpunkte:

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

durchschnittliche absolute Abweichung (aad) und=16/4=4.0

Standardabweichung (Standard) =80/4=20=4.47

In den Daten gibt es zwei Punkte, die 6 vom Mittelwert entfernt sind, und zwei Punkte, die 2 vom Mittelwert entfernt sind. Eine Abweichung von 4,47 ist also sinnvoller als 4.

Da die Gesamtbeobachtung immer , tauchen wir für die Berechnung von Standard nicht durch , sondern dividieren die Gesamtvarianz durch und ziehen ihre Quadratwurzel, um sie auf die gleiche Einheit wie die Originaldaten zu bringen.N N.NN


0

@ Mahesh Subramaniya - Dies ist nur eine mathematische Wendung . Wenn wir einen ursprünglichen Wert wie . Mit diesen beiden Gleichungen und können wir den gleichen Wert erhalten .a 2b = c a/b=()da2b=ccb=d

Mach es einfach mit = . Aber wir wollen nur Wert nicht minus. - 2,5522.5

Nun ist . Und522=12.512.52=2.5

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.