Ich habe Daten nämlich 365 Beobachtung von drei Variablen gesetzt enthält pm
, temp
und rain
. Jetzt möchte ich das Verhalten pm
als Reaktion auf Änderungen in anderen zwei Variablen überprüfen . Meine Variablen sind:
pm10
= Antwort (abhängig)temp
= Prädiktor (unabhängig)rain
= Prädiktor (unabhängig)
Das Folgende ist die Korrelationsmatrix für meine Daten:
> cor(air.pollution)
pm temp rainy
pm 1.00000000 -0.03745229 -0.15264258
temp -0.03745229 1.00000000 0.04406743
rainy -0.15264258 0.04406743 1.00000000
Das Problem ist, als ich die Konstruktion von Regressionsmodellen studierte, wurde geschrieben, dass die additive Methode darin besteht, mit der Variablen zu beginnen, die am stärksten mit der Antwortvariablen zusammenhängt. In meinem Datensatz rain
ist pm
(im Vergleich zu temp
) stark korreliert , aber gleichzeitig ist es eine Dummy-Variable (Regen = 1, kein Regen = 0), sodass ich jetzt eine Ahnung habe, wo ich anfangen soll. Ich habe zwei Bilder mit der Frage angehängt: Das erste ist ein Streudiagramm von Daten, und das zweite Bild ist ein Streudiagramm von pm10
vs. rain
, ich kann auch das Streudiagramm von pm10
vs. nicht interpretieren rain
. Kann mir jemand helfen, wie ich anfangen soll?