Ich muss eine komplexe Grafik für die visuelle Datenanalyse zeichnen. Ich habe 2 Variablen und eine große Anzahl von Fällen (> 1000). Zum Beispiel (die Zahl ist 100, wenn die Dispersion weniger "normal" sein soll):
x <- rnorm(100,mean=95,sd=50)
y <- rnorm(100,mean=35,sd=20)
d <- data.frame(x=x,y=y)
1) Ich muss Rohdaten mit Punktgröße zeichnen, die der relativen Häufigkeit von Zufällen entspricht, plot(x,y)
ist also keine Option - ich benötige Punktgrößen. Was ist zu tun, um dies zu erreichen?
2) Auf demselben Plot muss ich eine 95% -Konfidenzintervallellipse und eine Linie zeichnen, die die Änderung der Korrelation darstellt (ich weiß nicht, wie ich sie richtig benennen soll) - so etwas wie das:
library(corrgram)
corrgram(d, order=TRUE, lower.panel=panel.ellipse, upper.panel=panel.pts)
aber mit beiden Graphen auf einem Plot.
3) Schließlich muss ich darüber hinaus ein resultierendes lineares Regressionsmodell zeichnen:
r<-lm(y~x, data=d)
abline(r,col=2,lwd=2)
aber mit Fehlerbereich ... so etwas wie auf QQ-Plot:
aber für Anpassungsfehler, wenn es möglich ist.
Die Frage ist also:
Wie erreicht man all dies in einem Diagramm?