Was sind die statistischen Standardtests, um festzustellen, ob die Daten Exponential- oder Normalverteilungen folgen?
Was sind die statistischen Standardtests, um festzustellen, ob die Daten Exponential- oder Normalverteilungen folgen?
Antworten:
Anscheinend versuchen Sie zu entscheiden, ob Sie Ihre Daten mit der Normal- oder der Exponentialverteilung modellieren möchten. Dies erscheint mir etwas seltsam, da diese Verteilungen sehr unterschiedlich sind.
Die Normalverteilung ist symmetrisch, während die Exponentialverteilung ohne negative Werte stark nach rechts geneigt ist. Typischerweise enthält eine Stichprobe aus der Exponentialverteilung viele Beobachtungen, die relativ nahe bei und einige Beobachtungen, die weit rechts von 0 abweichen . Dieser Unterschied ist oft grafisch leicht zu erkennen.
Hier ist ein Beispiel, in dem ich Beobachtungen aus einer Normalverteilung mit Mittelwert 2 und Varianz 4 und einer Exponentialverteilung mit Mittelwert 2 und Varianz 4 simuliert habe :
Die Symmetrie der Normalverteilung und die Schiefe des Exponentials können unter Verwendung von Histogrammen, Boxplots und Streudiagrammen gesehen werden, wie in der obigen Abbildung dargestellt.
Ein weiteres sehr nützliches Werkzeug ist ein QQ-Plot . Im folgenden Beispiel sollten die Punkte ungefähr der Linie folgen, wenn die Probe aus einer Normalverteilung stammt. Wie Sie sehen können, ist dies bei den normalen Daten der Fall, nicht jedoch bei den Exponentialdaten.
Dieser Test ist eigentlich eine einseitige Version von Grubbs 'Test für Ausreißer . Sie finden dies in den meisten Statistiksoftware implementiert (stellen Sie jedoch sicher, dass Sie die richtige Version verwenden - für den Ausreißertest werden mehrere alternative Teststatistiken verwendet!).
Siehe KC Kapur und LR Lamberson Zuverlässigkeit in der Konstruktion . Wiley 1977.
Für die Normalität gelten Anderson-Darling und Shapiro-Wilk als die besten. Für den exponentiellen Lillerfors-Test wurde speziell dafür entwickelt.
Haben Sie grafische Methoden in Betracht gezogen, um zu sehen, wie sich die Daten verhalten?
Bei Wahrscheinlichkeitsgraphentechniken werden normalerweise die Daten eingestuft, die inverse CDF angewendet und die Ergebnisse dann auf der kartesischen Ebene aufgezeichnet. Auf diese Weise können Sie feststellen, ob mehrere Werte von der hypothetischen Verteilung abweichen und möglicherweise den Grund für die Abweichung erklären.