Was ist die Methode der Momente?
Es gibt einen schönen Artikel darüber auf Wikipedia.
https://en.m.wikipedia.org/wiki/Method_of_moments_(statistics)
Dies bedeutet, dass Sie die Populationsparameter schätzen, indem Sie die Parameter so auswählen, dass die Populationsverteilung die Momente aufweist, die den beobachteten Momenten in der Stichprobe entsprechen.
Wie unterscheidet es sich von MLE?
Die maximale Wahrscheinlichkeitsschätzung minimiert die Wahrscheinlichkeitsfunktion. In einigen Fällen kann dieses Minimum manchmal ausgedrückt werden, indem die Populationsparameter gleich den Stichprobenparametern gesetzt werden.
Wenn wir beispielsweise den mittleren Parameter einer Verteilung schätzen und MLE verwenden, verwenden wir häufig . Dies muss jedoch nicht immer der Fall sein (siehe: /stats//a/317631/164061, obwohl im Fall des Beispiels dort die Poisson-Verteilung, die MLE- und MoM-Schätzung übereinstimmen und die Gleiches gilt für viele andere. Zum Beispiel lautet die MLE-Lösung für die Schätzung von in einer Protokollnormalverteilung :μ=x¯ μμ
μ=1/n∑ln(xi)=ln(x)¯¯¯¯¯¯¯¯¯¯¯
Während die MoM-Lösung löst
exp(μ+12σ2)=x¯
führt zu
μ=ln(x¯)−12σ2
Das MoM ist daher eine praktische Methode zur Schätzung der Parameter, die häufig zu genau demselben Ergebnis wie das MLE führt (da die Momente der Stichprobe häufig mit den Momenten der Population übereinstimmen, z. B. wird ein Stichprobenmittelwert um den Populationsmittelwert verteilt, und bis zu einem gewissen Faktor / Bias funktioniert es sehr gut). Das MLE hat eine stärkere theoretische Grundlage und ermöglicht beispielsweise die Schätzung von Fehlern mithilfe der Fisher-Matrix (oder Schätzungen davon), und es ist ein viel natürlicherer Ansatz bei Regressionsproblemen (ich habe es nicht ausprobiert, aber ich denke, das ein MoM zum Lösen von Parametern in einer einfachen linearen Regressionfunktioniert nicht einfach und kann zu schlechten Ergebnissen führen. In der Antwort von Superpronker scheint dies durch eine gewisse Minimierung einer Funktion geschehen zu sein. Für MLE drückt diese Minimierung eine höhere Wahrscheinlichkeit aus, aber ich frage mich, ob sie für MoM so etwas Ähnliches darstellt.