Ich möchte mehrere lineare Regressionen durchführen und dann neue Werte mit wenig Extrapolation vorhersagen. Ich habe meine Antwortvariable im Bereich von -2 bis +7 und drei Prädiktoren (die Bereiche um +10 - +200). Die Verteilung ist nahezu normal. Aber die Beziehung zwischen der Antwort und den Prädiktoren ist nicht linear, ich sehe Kurven auf den Plots. Zum Beispiel wie folgt : http://cs10418.userapi.com/u17020874/153949434/x_9898cf38.jpg
Ich möchte eine Transformation anwenden, um Linearität zu erreichen. Ich habe versucht, die Antwortvariable zu transformieren, indem ich verschiedene Funktionen überprüft und die resultierenden Diagramme betrachtet habe, um eine lineare Beziehung zwischen der Antwort und den Prädiktoren zu erkennen. Und ich fand heraus, dass es viele Funktionen gibt, die mir eine sichtbare lineare Beziehung geben können. Zum Beispiel Funktionen
usw. ergeben ähnliche Ergebnisse: http://cs10418.userapi.com/u17020874/153949434/x_06f13dbf.jpg
Nachdem ich die vorhergesagten Werte (für als und so weiter). Die Verteilungen sind mehr oder weniger normal.
Wie kann ich die beste Transformation für meine Daten auswählen? Gibt es eine quantitative (und nicht sehr komplizierte) Möglichkeit, die Linearität zu bewerten? Um zu beweisen, dass die ausgewählte Transformation die beste ist, oder um sie nach Möglichkeit automatisch zu finden.
Oder ist die einzige Möglichkeit die nichtlineare multiple Regression?
plot(lm(1/(y+5)~r))