Ich möchte den Term und sein Quadrat (Prädiktorvariablen) in eine Regression einbeziehen, da ich davon ausgehe, dass niedrige Werte von einen positiven Effekt auf die abhängige Variable und hohe Werte einen negativen Effekt haben. Das sollte den Effekt der höheren Werte erfassen. Ich erwarte daher, dass der Koeffizient von positiv und der Koeffizient von negativ sein wird. Neben füge ich auch andere Prädiktorvariablen hinzu.x 2 x x 2 x x 2 x
Ich habe in einigen Beiträgen hier gelesen, dass es in diesem Fall eine gute Idee ist, die Variablen zu zentrieren, um Multikollinearität zu vermeiden. Wann sollten Sie bei der Durchführung einer multiplen Regression Ihre Prädiktorvariablen zentrieren und wann sollten Sie sie standardisieren?
Sollte ich beide Variablen separat zentrieren (im Mittelwert) oder sollte ich nur und dann das Quadrat nehmen oder sollte ich nur und das ursprüngliche einschließen ?x 2 x
Ist es ein Problem, wenn eine Zählvariable ist?
Um zu vermeiden, dass eine Zählvariable ist, habe ich darüber nachgedacht, es durch eine theoretisch definierte Fläche zu teilen, zum Beispiel 5 Quadratkilometer. Dies sollte einer Punktdichteberechnung etwas ähnlich sein.
Ich befürchte jedoch, dass in dieser Situation meine anfängliche Annahme über das Vorzeichen der Koeffizienten nicht mehr gelten würde, wie wenn und x² = 4
=
aber wäre dann kleiner, weil .