Der Eindruck, den ich aufgrund mehrerer Veröffentlichungen, Bücher und Artikel gewonnen habe, ist, dass die empfohlene Methode zum Anpassen einer Wahrscheinlichkeitsverteilung an einen Datensatz die Verwendung der Maximum Likelihood Estimation (MLE) ist. Als Physiker ist es jedoch intuitiver, das PDF des Modells mit Hilfe der kleinsten Quadrate an das empirische PDF der Daten anzupassen. Warum ist MLE dann besser als die kleinsten Quadrate bei der Anpassung der Wahrscheinlichkeitsverteilungen? Könnte mich jemand auf ein wissenschaftliches Dokument / Buch hinweisen, das diese Frage beantwortet?
Meine Vermutung ist, dass MLE kein Rauschmodell annimmt und das "Rauschen" im empirischen PDF heteroskedastisch und nicht normal ist.