Denn die Annahme normaler Fehler ist im Grunde genommen die gleiche wie die Annahme, dass keine großen Fehler auftreten! Die Normalverteilung hat so leichte Schwänze, dass Fehler außerhalb von Standardabweichungen mit sehr geringer Wahrscheinlichkeit auftreten, Fehler außerhalb von Standardabweichungen sind praktisch ausgeschlossen. In der Praxis ist diese Annahme selten richtig. Bei der Analyse kleiner, übersichtlicher Datensätze aus gut durchdachten Experimenten spielt dies möglicherweise keine große Rolle, wenn wir eine gute Analyse der Residuen durchführen. Bei Daten mit geringerer Qualität kann dies viel mehr ausmachen.± 3± 6
Bei Verwendung von Likelihood-basierten (oder Bayes'schen) Methoden bewirkt diese Normalität (wie oben erwähnt, ist dies effektiv die Annahme, dass keine großen Fehler vorliegen!), Dass die Folgerung sehr wenig robust wird. Die Ergebnisse der Analyse werden durch die großen Fehler zu stark beeinflusst! Dies muss so sein, da die Annahme "keine großen Fehler" unsere Methoden zwingt, die großen Fehler als kleine Fehler zu interpretieren. Dies kann nur durch Verschieben des Mittelwertparameters geschehen, um alle Fehler zu verkleinern. Eine Möglichkeit, dies zu vermeiden, ist die Verwendung sogenannter "robuster Methoden" (siehe http://web.archive.org/web/20160611192739/http://www.stats.ox.ac.uk/pub/StatMeth/Robust) .pdf
Aber Andrew Gelman wird sich nicht dafür entscheiden, da robuste Methoden in der Regel nicht-bayesisch dargestellt werden. Verwendung von t-verteilen Fehler in Likelihood / Bayesian Modellen ist eine andere Art und Weise robust Methoden zu erhalten, wie die -Verteilung schwerere tails als die normalen hat, also für einen größeren Anteil an großen Fehlern ermöglicht. Der Parameter für die Anzahl der Freiheitsgrade sollte im Voraus festgelegt und nicht aus den Daten geschätzt werden, da eine solche Schätzung die Robustheitseigenschaften der Methode (*) zerstört (es ist auch ein sehr schwieriges Problem, die Wahrscheinlichkeitsfunktion für , die Freiheitsgrade können unbegrenzt sein, was zu sehr ineffizienten (auch inkonsistenten) Schätzern führt.tν
Wenn Sie zum Beispiel glauben (befürchten), dass 1 von 10 Beobachtungen "große Fehler" sein könnten (über 3 sd), dann könnten Sie eine Verteilung mit 2 Freiheitsgraden verwenden und diese Zahl erhöhen, wenn die Es wird angenommen, dass der Anteil großer Fehler kleiner ist.t
Ich sollte beachten, dass das, was ich oben gesagt habe, für Modelle mit unabhängigen verteilten Fehlern gilt. Es gab auch Vorschläge für eine multivariate Verteilung (die nicht unabhängig ist) als Fehlerverteilung. : Das Propsal wird in dem Aufsatz „Kritik an der multivariaten Des Kaisers neue Kleider heftig kritisiert von TS Breusch, JC Robertson und AH Welsh, in Statistica Neerlandica (1997) Vol Regressionsmodell“. 51, nr. 3, S. 269-286, wo sie zeigen, dass die multivariate Fehlerverteilung empirisch nicht von der Normalverteilung zu unterscheiden ist. Diese Kritik wirkt sich jedoch nicht auf das unabhängige Modell aus. ttttt
(*) Ein Hinweis darauf ist Venables & Ripleys MASS --- Modern Applied Statistics mit S (auf Seite 110 in der 4. Ausgabe).