Betrachten Sie jede Ortsskalenfamilie, die durch eine "Standard" -Verteilung wird.F
ΩF={F(μ,σ):x→F(x−μσ)∣σ>0}.
Unter der Annahme, dass differenzierbar ist, stellen wir leicht fest, dass die PDFs .F1σf((x−μ)/σ)dx
Wenn diese Distributionen abgeschnitten werden, um ihre Unterstützung zwischen und ( einzuschränken , werden die PDFs durch ersetztaba<b
f(μ,σ;a,b)(x)=f(x−μσ)dxσC(μ,σ,a,b),a≤x≤b
(und sind Null für alle anderen Werte von ) wobei ist der Normalisierungsfaktor, der benötigt wird, um sicherzustellen, dass zur Einheit integriert wird. (Beachten Sie, dass ohne Kürzung identisch .) Die Log-Wahrscheinlichkeit für iid-Daten daherxC(μ,σ,a,b)=F(μ,σ)(b)−F(μ,σ)(a)f(μ,σ;a,b)C1xi
Λ(μ,σ)=∑i[logf(xi−μσ)−logσ−logC(μ,σ,a,b)].
Kritische Punkte (einschließlich globaler Minima) werden gefunden, wenn entweder (ein Sonderfall, den ich hier ignoriere) oder der Verlauf verschwindet. Unter Verwendung von Indizes zur Bezeichnung von Ableitungen können wir den Gradienten formal berechnen und die Wahrscheinlichkeitsgleichungen wie folgt schreibenσ=0
00=∂Λ∂μ=∂Λ∂σ=∑i⎡⎣⎢−fμ(xi−μσ)f(xi−μσ)−Cμ(μ,σ,a,b)C(μ,σ,a,b)⎤⎦⎥=∑i⎡⎣⎢−fσ(xi−μσ)σ2f(xi−μσ)−1σ−Cσ(μ,σ,a,b)C(μ,σ,a,b)⎤⎦⎥
Da und fest sind, sie aus der Notation und schreiben Sie als und als . (Ohne Kürzung wären beide Funktionen identisch Null.) Die Trennung der Terme, die die Daten betreffen, von den übrigen ergibtabnCμ(μ,σ,a,b)/C(μ,σ,a,b)A(μ,σ)nCσ(μ,σ,a,b)/C(μ,σ,a,b)B(μ,σ)
−A(μ,σ)−σ2B(μ,σ)−nσ=∑ifμ(xi−μσ)f(xi−μσ)=∑ifσ(xi−μσ)f(xi−μσ)
Wenn man diese mit der Situation ohne Verkürzung vergleicht, ist das offensichtlich
Alle ausreichenden Statistiken für das ursprüngliche Problem reichen für das abgeschnittene Problem aus (da sich die rechten Seiten nicht geändert haben).
Unsere Fähigkeit, geschlossene Lösungen zu finden, hängt von der Traktabilität von und . Wenn diese nicht auf einfache Weise und beinhalten , können wir nicht hoffen, dass wir im Allgemeinen geschlossene Lösungen erhalten.ABμσ
Für den Fall einer normalen Familie ergibt sich natürlich aus der kumulierten normalen PDF, die einen Unterschied zwischen den Fehlerfunktionen darstellt: Es besteht keine Chance, dass eine Lösung in geschlossener Form vorliegt im Allgemeinen erhalten. Es gibt jedoch nur zwei ausreichende Statistiken (der Stichprobenmittelwert und die Varianz reichen aus), und die CDF ist so glatt wie möglich, sodass numerische Lösungen relativ einfach zu erhalten sind.C(μ,σ,a,b)