Wie ist die Verteilung des (willkürlich) gewichteten Maximum Likelihood Estimator?


7

Angenommen, Sie beobachten den Vektor unabhängiger Variablen und y_i- abhängiger Variablen mit der Wahrscheinlichkeit l \ left (\ theta; X_i, y_i \ right) . Angenommen, die y_i sind unabhängig. Nehmen Sie außerdem an, Sie erhalten positive Gewichte , w_i, die beliebig sind, und berechnen den gewichteten Maximum Likelihood Estimator (WMLE?): \ Hat {\ theta} = \ arg \ max _ {\ theta} \ sum_ {1 \ le i \ le n } w_i \ log l \ left (\ theta; X_i, y_i \ right). Wie ist die Verteilung der WMLE, \ hat {\ theta} ?Xiyil(θ;Xi,yi)yiwi

θ^=argmaxθ1inwilogl(θ;Xi,yi).
θ^

Wenn ich die Frage weiter komplizieren darf, ohne sie in zwei Teile zu teilen, sind zwei Fälle zu berücksichtigen:

  1. Die wi sind völlig unabhängig von den Xi und yi .
  2. Die wi hängen in irgendeiner Weise von der abhängigen Variablen yi ab (möglicherweise deterministisch oder stochastisch).

Antworten:


2

Im Allgemeinen hat Ihre Frage keine Antwort. Es gibt mehrere Gründe.

1) Angenommen, alle . Selbst in diesem Fall hängt die Verteilung der MLE-Schätzung von der Verteilung der Daten ab, dh von der Funktion . Zum Beispiel kann nachgewiesen werden, dass in der exponentiellen Verteilungsfamilie in Kombination mit einigen weiteren Einschränkungen die MLE-Schätzung asymptotisch normal ist. Sobald jedoch außerhalb der Exponentialfamilie liegt, kann alles passieren.wi=1l(θ;x,y)l(θ;x,y)

2) Selbst wenn in der Exponentialfamilie liegt, ist es sehr wahrscheinlich, dass das Vorhandensein von Gewichten (insbesondere wenn sie von x und Y abhängig sind) die Ergebnisse der asymptotischen Verteilung ungültig macht.l(θ;x,y)


Nehmen wir an, wir arbeiten innerhalb der Exponential Family. Gibt es Ergebnisse für den Fall der völligen Unabhängigkeit der Gewichte und des ? X,y
Steveo'america

1
Ich denke, Sie nähern sich einem falschen Ende. Es gibt Möglichkeiten, Beobachtungsgewichte einzubeziehen, aber soweit ich weiß, weisen die Leute den Loglikelihood-Begriffen nicht nur Gewichte zu. In den mir bekannten Ergebnissen gehen sie davon aus, dass die Antwortvarianz zwischen den Beobachtungen nicht gleich ist und möglicherweise von X abhängt. Dann schreiben sie die entsprechende Wahrscheinlichkeit auf und sehen, wohin sie führt. Ein Beispiel finden Sie hier: stats.stackexchange.com/questions/118243/…
Nik Tuzov

2

Im Allgemeinen ist die Antwort von Nik Tuzov richtig, aber einige Details sind nicht vollständig richtig. Zusammenfassend ist die Verteilung der WMLE unbekannt. Sie können die tatsächliche Gleichung für die MLE (Gewichte oder keine) aufschreiben und die vollständige Ableitung schreiben, um das Maximum der Extrempunkte zu bestimmen. Dies gibt Ihnen eine rechnerische Antwort - aber ohne das spezifische Wissen über die zugrunde liegende Verteilung können Sie diese nicht ausführen.

Tatsächlich ändert das Vorhandensein der Gewichte nicht viel an der Frage, da Sie nur noch die Ableitung berechnen müssen. Die typische Verwendung von LE in der angewandten Wissenschaft erfolgt genau mit Gewichten, die von den als Poissonian verteilten Y-Think-Zählexperimenten / -ergebnissen abhängen, mit den damit verbundenen Unsicherheiten, die als Gewichte wirken.

In der praktischen Anwendung, in der die LE numerisch durchgeführt wird, ist eine typische Annäherung eine parabolische Form um den Maximalwert. Sie können dies entweder als "Normalverteilung" oder als erstes nicht verschwindendes Element der Taylor-Erweiterung interpretieren. Aber abgesehen von Sonderfällen ist es nicht genau (und kann sogar numerisch viel besser bestimmt werden).

Also: In einfachen Fällen können Sie für die zugrunde liegende Verteilung möglicherweise eine analytische Beschreibung für die resultierende Verteilung ableiten - wo die Reihe tatsächlich konvergiert. Ansonsten: nein, also generell auch: nein.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.