Wozu dient die von qqline () in R erzeugte Zeile?


20

Die qqnorm()R-Funktion erzeugt einen normalen QQ-Plot und qqline()fügt eine Linie hinzu, die durch das erste und dritte Quartil verläuft. Was ist der Ursprung dieser Linie? Ist es hilfreich, die Normalität zu überprüfen? Dies ist keine klassische Linie (die Diagonale möglicherweise nach linearer Skalierung).y=x

Hier ist ein Beispiel. Zuerst vergleiche ich die empirische Verteilungsfunktion mit der theoretischen Verteilungsfunktion von : Jetzt zeichne ich den qq-Plot mit der Linie ; Dieses Diagramm entspricht in etwa einer (nichtlinearen) Skalierung des vorherigen Diagramms: Hier ist jedoch das qq-Diagramm mit der Rqq-Linie: Dieses letzte Diagramm zeigt nicht die Abweichung wie im ersten Diagramm.y = μ + σ xN(μ^,σ^2)Vergleich der kumulativen Verteilungsfunktioneny=μ^+σ^xqqnorm zusammen mit der "guten" Linieqqnorm und qqline

Antworten:


9

Wie Sie auf dem Bild sehen können,Bildbeschreibung hier eingeben

erhalten von

> y <- rnorm(2000)*4-4
> qqnorm(y); qqline(y, col = 2,lwd=2,lty=2)

Die Diagonale wäre nicht sinnvoll, da die erste Achse in Bezug auf die theoretischen Quantile einer -Verteilung skaliert ist . Ich denke, dass die Verwendung des ersten und dritten Quartils zur Festlegung der Linie einen robusten Ansatz zur Schätzung der Parameter der Normalverteilung bietet, wenn man sie beispielsweise mit dem empirischen Mittelwert und der Varianz vergleicht. Abweichungen von der Linie (außer in den Endstücken) weisen auf einen Mangel an Normalität hin.N(0,1)


Die Diagonale "nach linearer Skalierung" ergibt sich hier durch abline (Mittelwert (y), sd (y)). Hier simulieren Sie normale Daten, daher sind diese beiden Linien nahe beieinander. Aber manchmal liegen die Daten nicht in der Nähe einer Normalverteilung, aber das QQ-Diagramm befindet sich in der Nähe der QQ-Linie, aber nicht in der Nähe der Diagonale "nach der Skalierung".
Stéphane Laurent

... Ich werde meiner Frage ein Beispiel hinzufügen
Stéphane Laurent

4
Ich denke, das war mein Argument, dass die Verwendung der Quartile robuster ist als die Verwendung des empirischen Mittels und der Varianz.
Xi'an,

1
Ok, vielen Dank. Nun scheint dies offensichtlich. Die qq-Linie könnte vorzuziehen sein, da in der Praxis manchmal die Nichtnormalität der Schwänze akzeptabel ist. Aber es gibt keine wirkliche Notwendigkeit, die QQ-Linie zu zeichnen: Eine visuelle Kontrolle ist ausreichend - das einzige, was wir brauchen, ist, die QQ-Handlung zu verstehen :)
Stéphane Laurent

1
Ok - ich tagge, aber die Antwort selbst war nicht zufriedenstellend: Die Antwort zusammen mit unserer Diskussion ist; aber das ist mein fehler: meine frage war nicht klar, bevor ich das beispiel hinzufüge. Meine Frage hat übrigens etwas mit dem KS-Test zu tun : Was ist mit der Wahl der Schätzungen und wenn wir ks.test (x, "pnorm", mu.hat, sigma.hat eingeben? )? & sgr;μ^σ^
Stéphane Laurent
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.