Es gibt viele Gründe, eine andere Fehlerverteilung zu wählen. Aber ich glaube, Sie wissen nicht, warum wir überhaupt Verteilungen für Variablen haben. Wenn dies offensichtlich ist, glaube ich, dass meine Antwort für Sie nutzlos ist, sorry.
Warum Distributionen wichtig sind
Verteilungen ermöglichen es uns, ein Modell in einer Wahrscheinlichkeitsrechnung zu betrachten, was bedeutet, dass wir Unsicherheiten über unser Modell quantifizieren können. Wenn wir in stat 101 erfahren, dass die Stichprobenverteilung des Stichprobenmittelwerts (asymptotisch) ist, können wir in einem probabilistischen Rahmen sagen Viele Dinge über diese Schätzung, wie das Testen von Hypothesen und das Erstellen von Konfidenzintervallen.X.¯∼˙N.( μ , σ)
Probabilistische Verteilungen in linearen und verallgemeinerten linearen Modellen
In einem linearen Modellrahmen können wir im Grunde dasselbe tun, wenn wir die Verteilung des Fehlerterms kennen. Warum? Dies ist ein Ergebnis der linearen Kombination von Zufallsvariablen ( siehe diese Antwort ). Aber der Punkt ist, wenn diese probabilistische Struktur im Modell vorhanden ist, können wir wieder einige Dinge tun. Neben dem Testen von Hypothesen und dem Erstellen von CI können wir vor allem Vorhersagen mit quantifizierter Unsicherheit, Modellauswahl, Anpassungsgüte und einer Reihe anderer Dinge erstellen.
Warum brauchen wir nun speziell GLMs? Erstens kann das probabilistische Gerüst eines linearen Modells verschiedene Arten davon nicht verarbeiten, wie z. B. Zählungen oder Binärdaten. Diese Datentypen unterscheiden sich grundlegend von regulären kontinuierlichen Daten, was bedeutet, dass eine Höhe von 1,83 Metern möglich ist, es jedoch sinnlos ist, wenn 4,5 elektrische Lichter nicht funktionieren.
Daher beginnt die Motivation für GLMs mit dem Umgang mit verschiedenen Datentypen, hauptsächlich durch die Verwendung von Verknüpfungsfunktionen oder / und durch die geschickte Manipulation des beabsichtigten Modells zu einem linear bekannten "Framework". Diese Bedürfnisse und Ideen hängen direkt damit zusammen, wie die Fehler durch das verwendete "Framework" modelliert werden.