Genau das sollten Sie erwarten.
Sie sehen genau dasselbe mit einem gewöhnlichen Regressionsmodell. wenn das Modell hatR.2höher als 0 werden Residuen mit der Antwort korreliert. Es sind die angepassten Werte, mit denen die Residuen nicht korreliert sind.
Insbesondere erfasst jede Regression alle Variationen in yDas erklären die Prädiktoren. Das zu tun bedeutet dasy^ ist nicht mit dem Residuum korreliert - denn wenn es nicht unkorreliert wäre, würde es eine nicht erfasste Variation geben, die die xkönnte erfassen. Als Ergebnis der Erfassung alles, was diexWenn im Regressionsmodell erfasst werden kann, muss eine Korrelation der Residuen mit dem tatsächlichen vorhanden sein y Werte:
Cov ( y, y- -y^) = Cov ( y- -y^, y- -y^) + Cov (y^, y- -y^) = Var ( y- -y^) + 0 =σ2
- Da diese Kovarianz positiv ist, wird die Korrelation sein.
Die Regularisierung ändert die Dinge etwas, aber die gleiche Korrelation erscheint.
[Die Komponente von yDas, was das Modell nicht erfasst, auch wenn es nur reines Rauschen ist, korreliert offensichtlich mit sich selbst . Das ist wirklich alles was wir hier sehen]
Eine solche Korrelation wird in jeder der Regressionen vorhanden sein, und so wird die Korrelation auf den zufälligen Wald als Ganzes übertragen.
Hier gibt es nichts zu reparieren, das soll es eigentlich tun. Sie sehen es auch dann, wenn Sie genau zu dem Modell passen, das Ihre Daten generiert hat.
x = rbeta(1000,1.8,1.8)*20+5 # make some x variable
y = 0.8+0.3*x+rnorm(1000,0,1.5) # simulate a regression model
lmfit = lm(y~x) # fit the true regression model
plot(y,lmfit$residual) # voila! $
cor(y,lmfit$residual)
In diesem Beispiel wird eine Korrelation in der Nähe von 70% angezeigt.
Wenn Sie die Varianz des Rauschausdrucks erhöhen (andere Dinge sind gleich), ist die Korrelation sogar stärker . Versuchen Sie das Obige mit mehr Lärm:
y = 0.8+0.3*x+rnorm(1000,0,2.5) # simulate a regression model
und sehen was passiert!
Es kann sein, dass Sie eine weitere Frage stellen möchten, die das ursprüngliche Problem erklärt, das Sie lösen wollten, da Ihre Entscheidung, wie Sie vorgehen möchten, möglicherweise nicht ideal war (es ist schwer zu sagen, was hier ist).