Was Sie beschreiben, bedarf einer besonderen Behandlung, es ist nicht das, was wir normalerweise mit "abgeschnittenen Zufallsvariablen" meinen - und was wir normalerweise meinen, ist, dass die Zufallsvariable nicht außerhalb der abgeschnittenen Unterstützung liegt, was bedeutet, dass es keine Konzentration der Wahrscheinlichkeitsmasse bei gibt der Punkt der Kürzung. Um Fälle zu kontrastieren:
A) "Übliche" Bedeutung eines abgeschnittenen RV
Für jede Verteilung, bei der wir seine Unterstützung abschneiden, müssen wir seine Dichte "korrigieren", damit sie sich zur Einheit integriert, wenn sie über die abgeschnittene Unterstützung integriert wird. Wenn die Variable Unterstützung in , - ∞ < a < b < ∞ hat , dann (pdf f , cdf F )[a,b]−∞<a<b<∞fF
∫bafX(x)dx=∫MafX(x)dx+∫bMfX(x)dx=∫MafX(x)dx+[1−FX(M)]=1
⇒∫MafX(x)dx=FX(M)
Da die LHS das Integral über dem abgeschnittenen Träger ist, sehen wir, dass die Dichte des abgeschnittenen rv, genannt , sein mussX~
so dass es sich über [ a , M ] zur Einheit integriert. Der Mittelbegriff im obigen Ausdruck lässt uns diese Situation (zu Recht) als eine Form derKonditionierung betrachten
fX~(x~)=fX(x∣X≤M)=fX(x)dx⋅[FX(M)]−1
[a,M]-Aber nicht auf einer anderen Zufallsvariablen, sondern auf den möglichen Werten, die der RV selbst annehmen kann. Hier wäre eine gemeinsame Dichte / Wahrscheinlichkeitsfunktion einer Sammlung von
abgeschnittenen iid rvs wie üblich das
n- fache der obigen Dichte.
nn
B) Wahrscheinlichkeitsmassenkonzentration
Hier, was Sie in der Frage beschreiben, sind die Dinge anders. Der Punkt konzentriert die gesamte Wahrscheinlichkeitsmasse, die der Unterstützung der Variablen entspricht, die höher als M ist . Dies erzeugt einen Punkt der Diskontinuität in der Dichte und macht sie zu zwei ZweigenM M
fX∗(x∗)fX∗(x∗)=fX(x∗)x∗<M=P(X∗≥M)x∗≥M
Formlos, ist die zweite „wie ein diskretes rv“ , wobei jeder Punkt in der Wahrscheinlichkeitsmassenfunktion tatsächliche Wahrscheinlichkeiten darstellt. Nehmen wir nun an, wir haben solche iid-Zufallsvariablen und wollen ihre gemeinsame Dichte / Wahrscheinlichkeitsfunktion bilden. Welchen Zweig sollten wir wählen, bevor wir uns die tatsächliche Stichprobe ansehen? Wir können diese Entscheidung nicht treffen, also müssen wir beide irgendwie einbeziehen. Dazu müssen wir Indikatorfunktionen verwenden: bezeichne I { x ∗ ≥ M } ≡ I ≥ M ( x ∗ ) die Indikatorfunktion, die den Wert 1 annimmt, wenn x ∗ ≥ M istnI{x∗≥M}≡I≥M(x∗)1x∗≥Mund sonst . Die Dichte eines solchen rv kann geschrieben werden0
und damit die Gelenkdichtefunktion von n solche iid Variablen ist
fX∗(x∗)=fX(x∗)⋅[1−I≥M(x∗)]+P(X∗≥M)⋅I≥M(x∗)
n
fX∗(X∗∣θ)=∏i=1n[fX(x∗i)⋅[1−I≥M(x∗i)]+P(X∗i≥M)⋅I≥M(x∗i)]
nMmMvm+v=nmP(X∗i≥M)v
L(θ∣{x∗i;i=1,...n})=∏i=1v[fX(x∗i)]⋅∏j=1m[P(X∗j≥M)]=∏i=1v[fX(x∗i)]⋅[P(X∗≥M)]m