Was sind in einfachen Worten die Annahmen der linearen Regression?
Ich möchte nur wissen, wann ich ein lineares Regressionsmodell auf unseren Datensatz anwenden kann.
Was sind in einfachen Worten die Annahmen der linearen Regression?
Ich möchte nur wissen, wann ich ein lineares Regressionsmodell auf unseren Datensatz anwenden kann.
Antworten:
Es gibt drei Hauptannahmen (statistisch genau genommen):
Zwischen den abhängigen Variablen und den Regressoren besteht eine lineare Beziehung (rechte Abbildung unten), was bedeutet, dass das von Ihnen erstellte Modell tatsächlich zu den Daten passt.
Die Fehler oder Residuen der Daten sind normal verteilt und unabhängig voneinander.
Homoskedastizität. Dies bedeutet, dass die Varianz um die Regressionslinie für alle Werte der Prädiktorvariablen gleich ist.
Update 2 :: Multikollinearität ist keine Annahme, sondern eine Überprüfung der Gesundheit, insbesondere wenn die Interpretierbarkeit des Modells wichtig ist (danke Ricardo Cruz für den Kommentar). Multikollinearität tritt auf, wenn die unabhängigen Variablen nicht unabhängig voneinander sind. Multikollinearität zwischen erklärenden Variablen, die zu weniger stabilen Parameteranpassungen führen kann (danke KT. Für diesen Hinweis). Es gibt Tests wie die Korrelationsmatrix (Pearson's Bivariate Correlation) und den Varianzinflationsfaktor, mit denen dies überprüft werden kann.
Homoscedasticity
eines Beispiels etwas besser erklären ? Es ist nicht klar. Sie haben eine meiner Fragen als Duplikat markiert, auf dem ich nach einer besseren Ansicht gesucht habe. Können Sie erklären?