Es sieht so aus, als ob Sie verwenden R
. Wenn ja, beachten Sie, dass Sie Punkte auf einem Streudiagramm mit ? Identifizieren können . Ich denke, hier sind mehrere Dinge im Gange. Erstens haben Sie einen sehr einflussreichen Punkt in der Handlung von LN_RT_vol_in ~ LN_AT_vol_in
(dem hervorgehobenen) bei ungefähr (.2, 1.5). Dies ist sehr wahrscheinlich das standardisierte Residuum, das etwa -3,7 beträgt. Der Effekt dieses Punkts besteht darin, die Regressionslinie zu glätten und sie horizontaler zu neigen als die scharf nach oben gerichtete Linie, die Sie sonst erhalten hätten. Dies hat zur Folge, dass alle Ihre Residuen relativ zu dem Ort gegen den Uhrzeigersinn gedreht werden, an dem sie sich sonst innerhalb des residual ~ predicted
Diagramms befunden hätten (zumindest wenn Sie an diese Kovariate denken und die andere ignorieren).
Die scheinbare gerade Linie der Residuen, die Sie sehen, ist jedoch immer noch vorhanden, da sie irgendwo in der dreidimensionalen Wolke Ihrer Originaldaten vorhanden sind. Sie können in beiden Randplots schwer zu finden sein. Sie können die Funktion identify () verwenden, um zu helfen, und Sie können auch das rgl- Paket verwenden, um ein dynamisches 3D- Streudiagramm zu erstellen, das Sie mit Ihrer Maus frei drehen können. Beachten Sie jedoch, dass die Residuen der geraden Linie in ihrem vorhergesagten Wert alle unter 0 liegen und Residuen unter 0 haben (dh sie liegen unter der angepassten Regressionslinie). Das gibt Ihnen einen großen Hinweis darauf, wo Sie suchen müssen. Schauen Sie sich noch einmal Ihre Handlung von anLN_RT_vol_in ~ LN_AT_vol_in
Ich glaube, ich kann sie sehen. Es gibt eine ziemlich gerade Ansammlung von Punkten, die diagonal nach unten und links von ungefähr (-.01, -1.00) am unteren Rand der Punktwolke in dieser Region verlaufen. Ich vermute, das sind die fraglichen Punkte.
Mit anderen Worten, die Residuen sehen so aus, weil sie sich bereits irgendwo im Datenraum so befinden. Im Wesentlichen schlägt @ttnphns dies vor, aber ich denke nicht, dass es in einer der ursprünglichen Dimensionen eine Konstante ist - es ist eine Konstante in einer Dimension in einem Winkel zu Ihren ursprünglichen Achsen. Ich stimme @MichaelChernick ferner zu, dass diese scheinbare Geradheit in der Restdarstellung wahrscheinlich harmlos ist, Ihre Daten jedoch nicht wirklich normal sind. Sie sind jedoch etwas normal und Sie scheinen eine anständige Anzahl von Daten zu haben, so dass das CLT Sie möglicherweise abdeckt, aber Sie möchten möglicherweise nur für den Fall einen Bootstrap durchführen. Schließlich würde ich mir Sorgen machen, dass dieser Ausreißer Ihre Ergebnisse beeinflusst. Ein robuster Ansatz ist wahrscheinlich angebracht.