Was sagt uns die Standardabweichung bei nicht normaler Verteilung?


40

In einer Normalverteilung hat die Regel 68-95-99.7 eine große Bedeutung für die Standardabweichung, aber was würde die Standardabweichung in einer nicht normalen Verteilung bedeuten (multimodal oder schief)? Würden alle Datenwerte noch innerhalb von 3 Standardabweichungen liegen? Haben wir Regeln wie die 68-95-99.7 für nicht normale Distributionen?



@COOLSerdash großartig. Dies beantwortet meine Frage perfekt.
Zuhaib Ali

3
Der Punkt von @ COOLSerdash ist hier genau richtig, aber beachten Sie, dass die Standardaussage über Chebyshevs Ungleichung sich auf die wahre a priori bekannte SD bezieht, nicht auf eine aus Ihrer Stichprobe geschätzte SD. Es kann hilfreich sein, diesen ausgezeichneten CV-Thread zu lesen: Gibt es eine Beispielversion der einseitigen Chebeshev-Ungleichung?
gung - Wiedereinsetzung von Monica

Außerdem sollten Sie sich wahrscheinlich nicht gleich mit Chebyshev zufrieden geben - Sie können wahrscheinlich viel besser, schief oder nicht.
Steve S

1
@gung so funktioniert die 68-95-99.7 Regel!
Glen_b

Antworten:


12

Die Standardabweichung ist ein bestimmtes Maß für die Abweichung. Es gibt mehrere andere, die mittlere absolute Abweichung ist ziemlich populär. Die Standardabweichung ist keineswegs speziell. Das Besondere daran ist, dass die Gaußsche Verteilung besonders ist.

Wie in den Kommentaren ausgeführt, ist Chebyshevs Ungleichung nützlich, um ein Gefühl zu bekommen. Es gibt jedoch mehr .


9

Es ist die Quadratwurzel des zweiten zentralen Moments , der Varianz. Die Momente beziehen sich auf charakteristische Funktionen (CF), die als charakteristisch bezeichnet werden, weil sie die Wahrscheinlichkeitsverteilung definieren. Wenn Sie also alle Momente kennen, kennen Sie CF, daher kennen Sie die gesamte Wahrscheinlichkeitsverteilung.

Die charakteristische Funktion der Normalverteilung wird durch nur zwei Momente definiert: Mittelwert und Varianz (oder Standardabweichung). Daher ist für die Normalverteilung die Standardabweichung besonders wichtig, sie entspricht in gewisser Weise 50% ihrer Definition.

Für andere Verteilungen ist die Standardabweichung in gewisser Weise weniger wichtig, weil sie andere Momente haben. Für viele in der Praxis verwendete Distributionen sind die ersten Momente jedoch die größten, sodass sie die wichtigsten sind, die es zu wissen gilt.

Nun können Sie intuitiv anhand des Mittelwerts erkennen, wo sich das Zentrum Ihrer Verteilung befindet, und anhand der Standardabweichung, wie nahe sich Ihre Daten an diesem Zentrum befinden.

Da die Standardabweichung in den Einheiten der Variablen angegeben ist, werden auch andere Momente skaliert, um Messwerte wie z. B. Kurtosis zu erhalten . Kurtosis ist eine dimensionslose Metrik, die Ihnen sagt, wie fett die Schwänze Ihrer Verteilung im Vergleich zu normal sind


1
"Nun können Sie intuitiv anhand des Mittelwerts erkennen, wo sich das Zentrum Ihrer Verteilung befindet, und anhand der Standardabweichung, wie nahe Ihre Daten an diesem Zentrum liegen." - Gilt das nicht nur, wenn die Verteilung normal ist? Ansonsten ist der Median meistens ein besseres Maß für die zentrale Tendenz.
Dan Temkin

@DanTemkin Bei Verwendung des Medians verliert die Standardabweichung ihren Wert bis zu einem gewissen Grad. Es wird aus dem Mittelwert berechnet. Mit Median ist es dann sinnvoll, über Quantile zu sprechen, was ein Weg sein könnte, um mit verzerrten Verteilungen umzugehen. OP konzentrierte sich jedoch nicht auf verzerrte Distributionen. Für jede symmetrische Verteilung, für die Sie mean = median haben, muss top nicht normal sein. Daher ist es sinnvoll, über Mittelwerte zu sprechen, wenn Standardabweichungen diskutiert werden.
Aksakal

4

Die Standardabweichung der Stichprobe ist ein Maß für die Abweichung der beobachteten Werte vom Mittelwert in denselben Einheiten zur Messung der Daten. Normalverteilung oder nicht.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.