Es ist wahr, dass die Annahmen der linearen Regression nicht realistisch sind. Dies gilt jedoch für alle statistischen Modelle. "Alle Modelle sind falsch, aber einige sind nützlich."
Ich vermute, Sie haben den Eindruck, dass es keinen Grund gibt, eine lineare Regression zu verwenden, wenn Sie ein komplexeres Modell verwenden könnten. Dies ist nicht der Fall, da komplexere Modelle im Allgemeinen anfälliger für Überanpassungen sind und mehr Rechenressourcen benötigen. Dies ist wichtig, wenn Sie beispielsweise versuchen, Statistiken auf einem eingebetteten Prozessor oder einem Webserver zu erstellen. Einfachere Modelle sind auch leichter zu verstehen und zu interpretieren. Im Gegensatz dazu tendieren komplexe maschinelle Lernmodelle wie neuronale Netze dazu, mehr oder weniger als Black Box zu enden.
Auch wenn die lineare Regression eines Tages praktisch nicht mehr sinnvoll ist (was auf absehbare Zeit äußerst unwahrscheinlich erscheint), bleibt sie theoretisch von Bedeutung, da komplexere Modelle in der Regel auf der linearen Regression als Grundlage aufbauen. Um beispielsweise eine regulierte logistische Regression mit gemischten Effekten zu verstehen, müssen Sie zunächst eine einfache alte lineare Regression verstehen.
Dies soll nicht heißen, dass komplexere, neuere und glänzendere Modelle nicht nützlich oder wichtig sind. Viele von ihnen sind. Die einfacheren Modelle sind jedoch allgemeiner anwendbar und daher wichtiger und es ist klar, sie zuerst zu präsentieren, wenn Sie eine Vielzahl von Modellen präsentieren möchten. Es gibt heutzutage viele schlechte Datenanalysen, die von Leuten durchgeführt werden, die sich selbst als "Datenwissenschaftler" bezeichnen oder so, aber nicht einmal die grundlegenden Dinge kennen, wie zum Beispiel, was ein Konfidenzintervall wirklich ist. Sei keine Statistik!