Ja, wir können anhand des Stichprobenmittelwerts und der Varianz ein analoges Ergebnis erzielen, wobei möglicherweise ein paar leichte Überraschungen dabei auftauchen.
Zunächst müssen wir die Fragestellung ein wenig verfeinern und einige Annahmen machen. Es sollte klar sein, dass wir nicht hoffen können, die Populationsvarianz durch die Stichprobenvarianz auf der rechten Seite zu ersetzen, da letztere zufällig ist ! Wir konzentrieren unsere Aufmerksamkeit also erneut auf die äquivalente Ungleichung
Falls es nicht klar ist, dass diese äquivalent sind, beachten Sie, dass wir in der ursprünglichen Ungleichung einfach durch ohne dass die Allgemeinheit darunter leidet.t t σ
P(X−EX≥tσ)≤11+t2.
ttσ
Zweitens nehmen wir an, dass wir eine Zufallsstichprobe und dass wir an einer Obergrenze für die analoge Größe interessiert sind
, wobei die Stichprobe ist Mittelwert und ist die Standardabweichung der Stichprobe.P ( X 1 - ≤ X ≥ t S ) ≤ X SX1,…,XnP(X1−X¯≥tS)X¯S
Einen halben Schritt vorwärts
Beachten Sie, dass wir bereits durch Anwenden der ursprünglichen einseitigen Chebyshev-Ungleichung auf das
wobei , was kleiner als die rechte Seite der Originalversion ist. Das macht Sinn! Jede bestimmte Erkenntnis einer Zufallsvariablen aus einer Stichprobe liegt in der Regel (geringfügig) näher am Stichprobenmittelwert, zu dem sie beiträgt, als am Populationsmittelwert. Wie wir weiter unten sehen werden, werden wir unter noch allgemeineren Annahmen durch ersetzen . P ( X 1 - ˉ X ≥ t σ ) ≤ 1X1−X¯σ2=VeinR(X1)σS
P(X1−X¯≥tσ)≤11+nn−1t2
σ2= V a r ( X1)σS
Eine Beispielversion von einseitigem Chebyshev
Behauptung : Sei eine Zufallsstichprobe mit . Dann istInsbesondere ist die Beispielversion der Schranke enger als die ursprüngliche Populationsversion.P ( S = 0 ) = 0 P ( X 1 - ˉ X ≥ t S ) ≤ 1X1, … , XnP (S= 0 ) = 0
P ( X1- X¯≥ t S) ≤ 11 + nn - 1t2.
Hinweis : Wir gehen nicht davon aus, dass die entweder einen endlichen Mittelwert oder eine Varianz haben!Xich
Beweis . Die Idee ist, den Beweis der ursprünglichen einseitigen Chebyshev-Ungleichung anzupassen und dabei Symmetrie anzuwenden. Setzen Sie zunächst um die Schreibweise zu . Dann beobachte, dass
P ( Y 1 ≥ t S ) = 1Y.ich= Xich- X¯
P ( Y1≥ t S) = 1n∑i = 1nP ( Yich≥ t S) = E 1n∑i = 1n1( Yich≥ t S).
Nun, für jedes , auf ,
{ S > 0 } 1 ( Y i ≥ t S ) = 1 ( Y i + t c S ≥ T S ( 1 + c ) ) ≤ 1 ( ( Y i + t c S ) 2 ≥ t 2 ( 1 + c ) 2 S 2 ) ≤ ( Yc > 0{ S> 0 }
1( Yich≥ t S)= 1( Yich+ t c S≥ t S( 1 + c ) )≤ 1( ( Yich+ t c S)2≥ t2( 1 + c )2S2)≤ ( Yich+ t c S)2t2( 1 + c )2S2.
Dann ist
da und .ˉ Y = 0 ∑ i Y 2 i = ( n - 1 ) S 2
1n∑ich1( Yich≥ t S)≤ 1n∑ich( Yich+ t c S)2t2( 1 + c )2S2= ( n - 1 ) S2+ n t2c2S2n t2( 1 + c )2S2= ( n - 1 ) + n t2c2n t2( 1 + c )2,
Y.¯= 0∑ichY.2ich= ( n - 1 ) S2
Die rechte Seite ist eine Konstante ( ! ), So dass sich unter Berücksichtigung der Erwartungen auf beiden Seiten ergibt:
Schließlich ergibt die Minimierung über , was nach einer kleinen Algebra das Ergebnis festlegt.
P ( X1- X¯≥ t S) ≤ ( n - 1 ) + n t2c2n t2( 1 + c )2.
cc = n - 1n t2
Dieser lästige technische Zustand
Beachten Sie, dass wir annehmen mussten, um in der Analyse durch dividieren zu können . Für absolut kontinuierliche Verteilungen ist dies kein Problem, für diskrete Verteilungen jedoch ein Nachteil. Für eine diskrete Verteilung besteht eine gewisse Wahrscheinlichkeit, dass alle Beobachtungen gleich sind. In diesem Fall ist für alle und .P (S= 0 ) = 0S20 = Yich= t S= 0icht > 0
Wir können uns herauswinden, indem wir . Dann zeigt eine sorgfältige Abwägung des Arguments, dass alles praktisch unverändert durchläuft und wir bekommenq= P ( S= 0 )
Folgerung 1 . Für den Fall haben wirq= P ( S= 0 ) > 0
P ( X1- X¯≥ t S) ≤ ( 1 - q) 11 + nn - 1t2+ q.
Beweis . Teilen Sie die Ereignisse und . Der vorherige Beweis geht für und der Fall ist trivial.{ S> 0 }{ S= 0 }{ S> 0 }{ S= 0 }
Eine etwas sauberere Ungleichung ergibt sich, wenn wir die nicht strenge Ungleichung in der Wahrscheinlichkeitsangabe durch eine strenge Version ersetzen.
Folgerung 2 . Sei (möglicherweise Null). Dann istq= P ( S= 0 )
P ( X1- X¯> t S) ≤ ( 1 - q) 11 + nn - 1t2.
Schlussbemerkung : Die Probe - Version der Ungleichheit benötigte keine Annahmen über (außer , dass es nicht fast sicher sein , konstant in dem nicht strikter Ungleichheit Fall, der die Originalversion auch davon ausgegangen , stillschweigend) im Wesentlichen vor , weil die Probe Mittelwert und Probenvarianz existieren immer, unabhängig davon, ob es ihre Populationsanaloga tun oder nicht.X