Was ist ein Schätzer der Standardabweichung der Standardabweichung, wenn eine Normalität der Daten angenommen werden kann?
Was ist ein Schätzer der Standardabweichung der Standardabweichung, wenn eine Normalität der Daten angenommen werden kann?
Antworten:
Sei . Wie in diesem Thread gezeigt , ist die Standardabweichung der Probe Standardabweichung,
ist
Dabei ist die Gammafunktion , die Stichprobengröße und der Stichprobenmittelwert. Da ein konsistenter Schätzer von , schlägt dies vor, durch in der obigen Gleichung zu ersetzen , um einen konsistenten Schätzer von .n ¯ X = 1s& sgr;& sgr;sSD(s)
Wenn es sich um einen unvoreingenommenen Schätzer handelt, den Sie suchen, sehen wir in diesem Thread, dass , was aufgrund der Linearität der Erwartung nahe legt
als unvoreingenommener Schätzer von . All dies zusammen mit der Linearität der Erwartung ergibt einen unvoreingenommenen Schätzer für : S D ( s )
Angenommen, Sie beobachten iid von einer Normalen mit Mittelwert Null und Varianz . Die (empirische) Standardabweichung ist die Quadratwurzel des Schätzers von (unvoreingenommen oder nicht, das ist nicht die Frage). Als Schätzer (erhalten mit ) hat eine Varianz, die theoretisch berechnet werden kann. Vielleicht ist die von Ihnen als Standardabweichung der Standardabweichung bezeichnete Quadratwurzel der Varianz der Standardabweichung, dh ? Es ist kein Schätzer, es ist eine theoretische Größe (so etwas wieσ 2 σ 2 σ 2 X 1 , ... , X n σ √ σ/ √ muss noch bestätigt werden) das kann explizit berechnet werden!
@Macro lieferte eine großartige mathematische Erklärung mit zu berechnenden Gleichungen. Hier ist eine allgemeinere Erklärung für weniger mathematische Leute.
Ich denke, die Terminologie "SD of SD" ist für viele verwirrend. Es ist einfacher, über das Konfidenzintervall einer SD nachzudenken. Wie genau ist die Standardabweichung, die Sie aus einer Stichprobe berechnen? Möglicherweise haben Sie zufällig Daten erhalten, die eng beieinander liegen, sodass die Stichproben-SD viel geringer ist als die Populations-SD. Oder Sie haben zufällig Werte erhalten, die viel stärker gestreut sind als die Gesamtpopulation, wodurch die Stichproben-SD höher ist als die Populations-SD.
Das Interpretieren des CI des SD ist unkompliziert. Beginnen Sie mit der üblichen Annahme, dass Ihre Daten zufällig und unabhängig von einer Gaußschen Verteilung erfasst wurden. Wiederholen Sie nun diese Abtastung viele Male. Sie erwarten, dass 95% dieser Konfidenzintervalle die wahre Populations-SD enthalten.
Wie breit ist das 95% -Konfidenzintervall einer SD? Dies hängt natürlich von der Stichprobengröße (n) ab.
n: 95% CI von SD
2: 0,45 * SD bis 31,9 * SD
3: 0,52 * SD bis 6,29 * SD
5: 0,60 * SD bis 2,87 * SD
10: 0,69 * SD bis 1,83 * SD
25: 0,78 * SD bis 1,39 * SD
50: 0,84 * SD bis 1,25 * SD
100: 0,88 * SD bis 1,16 * SD
500: 0,94 * SD bis 1,07 * SD