Angenommen, ich habe eine Reihe unabhängiger, identisch verteilter univariater Beobachtungen und zwei Hypothesen darüber, wie x erzeugt wurde:
: x wird aus einer einzelnen Gaußschen Verteilung mit unbekanntem Mittelwert und unbekannter Varianz gezogen.
: x wird aus einer Mischung von zwei Gaußschen mit unbekanntem Mittelwert, Varianz und Mischungskoeffizienten gezogen.
Wenn ich richtig verstehe, sind diese verschachtelte Modelle seit dem Modell , dass repräsentiert in Bezug auf die beschrieben werden können , H werden kann, wenn Sie die Parameter der beiden Gaußschen auf identisch beschränken oder den Mischungskoeffizienten für einen der beiden Gaußschen auf Null beschränken .
Daher sollten Sie in der Lage sein, den EM-Algorithmus zum Schätzen der Parameter von und dann mithilfe des Wilks-Theorems zu bestimmen, ob die Wahrscheinlichkeit der Daten unter H A signifikant größer ist als die unter H 0 . Es gibt einen kleinen Vertrauenssprung in die Annahme, dass der EM-Algorithmus hier zur maximalen Wahrscheinlichkeit konvergiert, aber ich bin bereit, dies zu tun.
Ich versuchte , diese in einer Monte - Carlo - Simulation unter der Annahme , dass hat 3 mehr Freiheitsgrade als H 0 (den Mittelwert und die Varianz für die zweite Gaußsche und die Mischparameter). Als ich Daten von H 0 simulierte , erhielt ich eine P-Wert-Verteilung, die im Wesentlichen ungleichmäßig war und für kleine P-Werte angereichert wurde. (Wenn EM nicht zur wahren maximalen Wahrscheinlichkeit konvergieren würde, wäre das genaue Gegenteil zu erwarten.) Was ist falsch an meiner Anwendung des Wilks-Theorems, das diese Verzerrung erzeugt?