Welche Bedeutung hat die Unterscheidung zwischen linearen und nichtlinearen Modellen? Die Frage Nichtlineares vs. verallgemeinertes lineares Modell: Wie verweisen Sie auf logistische, Poisson usw. Regression? und ihre Antwort war eine äußerst hilfreiche Klärung der Linearität / Nichtlinearität verallgemeinerter linearer Modelle. Es scheint von entscheidender Bedeutung zu sein, lineare von nichtlinearen Modellen zu unterscheiden, aber mir ist nicht klar, warum? Betrachten Sie beispielsweise die folgenden Regressionsmodelle:
Beide Modelle 1 und 2 sind linear, und die Lösungen für in geschlossener Form vor, die mit einem Standard-OLS-Schätzer leicht gefunden werden können. Nicht so für die Modelle 3 und 4, die nichtlinear sind, da (einige) Derivate von wrt immer noch Funktionen von .
Eine einfache Lösung für die Schätzung von in Modell 3 besteht darin, das Modell zu linearisieren, indem Sie , mit einem linearen Modell schätzen und dann berechnen .
Um die Parameter in Modell 4 abzuschätzen, können wir annehmen, dass einer Binomialverteilung (Mitglied der Exponentialfamilie) folgt, und unter Verwendung der Tatsache, dass die logistische Form des Modells die kanonische Verknüpfung ist, die rhs des Modells linearisieren. Dies war der entscheidende Beitrag von Nelder und Wedderburn .
Aber warum ist diese Nichtlinearität überhaupt ein Problem? Warum kann man nicht einfach einen iterativen Algorithmus verwenden, um Modell 3 zu lösen, ohne mit der Quadratwurzelfunktion zu linearisieren, oder Modell 4, ohne GLMs aufzurufen? Ich vermute, dass Statistiker vor der Verbreitung von Rechenleistung versuchten, alles zu linearisieren. Wenn dies zutrifft, sind die durch die Nichtlinearität verursachten "Probleme" möglicherweise ein Überbleibsel der Vergangenheit? Sind die durch nichtlineare Modelle verursachten Komplikationen rein rechnerisch oder gibt es einige andere theoretische Probleme, die es schwieriger machen, nichtlineare Modelle an Daten anzupassen als lineare Modelle?