Lösung zur Ausübung von 2.2a.16 von „Robuste Statistik: Der auf Einflussfunktionen basierende Ansatz“


9

Auf Seite 180 von Robust Statistics: Der auf Einflussfunktionen basierende Ansatz findet sich folgende Frage:

  • 16: Zeigen Sie, dass für ortsinvariante Schätzer immer ε12 . Finden Sie die entsprechende Obergrenze für den Finite-Sample-Breakdown-Punktεn , sowohl für den Fall, dassnungerade odernist.

Der zweite Teil (nach dem Punkt) ist eigentlich trivial (angesichts des ersten), aber ich kann keinen Weg finden, den ersten Teil (Satz) der Frage zu beweisen.

In dem Abschnitt des Buches, der sich auf diese Frage bezieht, findet man (S. 98):

εnTn(xl,,xn)

εn(Tn;xi,,xn):=1nmax{m:maxi1,,imsupy1,,ym|Tn(z1,,zn)|<}

wobei die Stichprobe erhalten wird, indem Datenpunkte durch beliebige Werte m y 1 , , y m .(z1,,zn)mxi1,,ximy1,,ym.

Die formale Definition von selbst läuft fast eine Seite, kann aber als Obwohl nicht explizit definiert, eine kann erraten, dass bedeutet, dass erfüllen muss ε * = lim n ε * n T n T n ( x 1 , ... , x n ) = T n ( x 1 + c , ... , x n + c ) ,  für alle  c Rε

ε=limnεn
Tn
Tn(x1,,xn)=Tn(x1+c,,xn+c), for all cR

Ich beantworte Whubers Frage im Kommentar unten. Das Buch definiert, dass der Schätzer mehrere Seiten umfasst. Ab Seite 82 versuche ich, die Hauptteile zu reproduzieren (ich denke, es wird die Frage von Whuber beantworten):Tn

Angenommen, wir haben eindimensionale Beobachtungen die unabhängig und identisch verteilt sind (iid). Die Beobachtungen gehören zu einem Probenraum , der eine Teilmenge der realen Linie (häufig entspricht einfach selbst, sodass die Beobachtungen einen beliebigen Wert annehmen können ). Ein parametrisches Modell besteht aus einer Familie von Wahrscheinlichkeitsverteilungen im Probenraum, wobei der unbekannte Parameter zu einem ParameterraumH R H R F θ θ Θ(X1,,Xn)HRHRFθθΘ

...

Wir identifizieren die Probe mit ihrer empirischen Verteilung und ignorieren dabei die Reihenfolge der Beobachtungen (wie fast immer). Formal ist gegeben durch wobei die Punktmasse 1 in . Als Schätzer von wir reelle Statistiken . Im weiteren Sinne kann ein Schätzer als eine Folge von Statistiken , eine für jede mögliche Stichprobengröße . Im Idealfall werden die Beobachtungen gemäß einem Mitglied des parametrischen Modells iid G n G n ( 1 / n ) n i = 1 Δ x i Δ X X θ T n = T n ( X 1 , , X n ) = T n ( G n ) { T n , n 1 } n {(X1,,Xn)GnGn(1/n)i=1nΔxiΔXXθTn=Tn(X1,,Xn)=Tn(Gn){Tn,n1}nF ( H ) H.{Fθ;θΘ} , aber die Klasse aller möglichen Wahrscheinlichkeitsverteilungen auf ist viel größer.F(H)H

Wir betrachten Schätzer, die Funktionale sind [dh für alle und ] oder asymptotisch durch Funktionale ersetzt werden können. Dies bedeutet, dass wir annehmen, dass es ein funktionales [wobei die Domäne von die Menge aller Verteilungen für die definiert ist], so dass in der Wahrscheinlichkeit, wenn die Beobachtungen gemäß der wahren Verteilung in iid sind . Wir sagen, dassn G n T : Domäne ( T ) R T F ( H ) T T n ( X 1 , , X n ) n T ( G ) G- Domäne ( T ) T ( G ) { T nTn(Gn)=T(Gn)nGnT:domain(T)RTF(H)T

Tn(X1,,Xn)nT(G)
Gdomain(T)T(G)der asymptotische Wert ist bei .G.{Tn;n1}G

...

In diesem Kapitel nehmen wir immer an, dass die untersuchten Funktionale Fisher-konsistent sind (Kallianpur und Rao, 1955): was bedeutet, dass bei Das Modell des Schätzers misst asymptotisch die richtige Größe. Der Begriff der Fisher-Konsistenz ist für Funktionale geeigneter und eleganter als die übliche Konsistenz oder asymptotische Unparteilichkeit.{ T n ; n 1 }

T(Fθ)=θ for all θΘ
{Tn;n1}


1
Wie genau definiert dieses Buch "Schätzer"? Es scheint mir, dass jeder begrenzte Schätzer einen Durchschlagspunkt von , so dass er Sicherheit besondere Einschränkungen ; und es gibt immer begrenzte ortsinvariante Schätzer (sie enthalten die Konstanten). 1 T nTn1Tn
whuber

1
Vielen Dank für das erweiterte Material. Es scheint immer noch viele Gegenbeispiele zu geben. Ein einfacher ist der konstante Schätzer für die Ein-Parameter-Familie der Normalverteilungen der Varianz . Dies ist ein ortsinvarianter Schätzer der Varianz. Sein Durchschlagpunkt ist . Es ist Fisher-konsistent (trivial), aber ich muss die Definition sorgfältig interpretieren: " " kann sich nicht unbedingt auf alle Parameter beziehen , denn dann könnte kein ortsinvarianter Schätzer konsistent sein! 1 1 θTn(X1,,Xn)=111θ
whuber

@whuber: Danke, ich verstehe dein Gegenbeispiel. Ich denke, ich werde den Autor kontaktieren und um weitere Informationen bitten ...
user603

Antworten:


4

Ältere Statistikbücher verwendeten "invariant" auf etwas andere Weise als erwartet; Die mehrdeutige Terminologie bleibt bestehen. Ein moderneres Äquivalent ist "äquivariant" (siehe die Referenzen am Ende dieses Beitrags). Im vorliegenden Zusammenhang bedeutet es

Tn(X1+c,X2+c,,Xn+c)=Tn(X1,X2,,Xn)+c

für alle echten .c

Um die Frage zu beantworten, nehmen wir an, dass die Eigenschaft hat, dass für ausreichend großes alle reellen und alle ,Tnncmεn

|Tn(X+Y)Tn(X)|=o(|c|)

wann immer von um höchstens in höchstens Koordinaten abweicht .YXcm

(Dies ist eine schwächere Bedingung als in der Definition der Aufschlüsselungsgrenze angenommen. Tatsächlich müssen wir nur annehmen, dass der Ausdruck " " , wenn ausreichend groß ist, ein Wert ist, der garantiert kleiner als ist groß.)no(|c|)|c|/2

Der Beweis ist im Widerspruch. Nehmen Sie dementsprechend an, dass dieses auch äquivariante ist, und nehmen Sie . Dann für hinreichend große , eine ganze Zahl ist, für die sowohl und . Für alle reellen Zahlen definierenTnε>1/2nm(n)=εnm(n)/nε(nm(n))/nεa,b

tn(a,b)=Tn(a,a,,a, b,b,,b)

wo es 's und ' s gibt. Durch Ändern von oder weniger der Koordinaten schließen wir beidem(n) anm(n) bm(n)

|t(a,b)t(0,b)|=o(|a|)

und

|t(a,b)t(a,0)|=o(|b|).

Für die Dreiecksungleichung behauptetc>0

c=|tn(c,c)tn(0,0)||tn(c,c)tn(c,0)|+|tn(c,0)tn(0,0)|=o(c)+o(c)<c/2+c/2=c

Die strikte Ungleichung auf der vorletzten Linie ist für ausreichend großes gewährleistet . Der damit verbundene Widerspruch beweistnc<cε1/2.


Verweise

EL Lehmann, Theorie der Punktschätzung . John Wiley 1983.

Im Text (Kapitel 3, Abschnitt 1) ​​und einer dazugehörigen Fußnote schreibt Lehmann

Ein Schätzer, der für alle erfüllt, wird als äquivariante ...δ(X1+a,,Xn+a)=δ(X1,,Xn)+aa

Einige Autoren nennen solche Schätzer "invariant". Da dies darauf hindeutet, dass der Schätzer unter unverändert bleibt , scheint es vorzuziehen, diesen Term für Funktionen zu reservieren, die für alle erfüllen .u ( x + a ) = u ( x ) x , aXi=Xi+au(x+a)=u(x)x,a


1
Ja, ich habe gestern den Hauptautor des Buches mit der gleichen Frage zur tatsächlich verwendeten Definition der Invarianz kontaktiert (ich habe im Index nachgesehen und konnte sie im Buch nicht explizit finden). Ich habe positiv gestimmt, weil ich denke, dass Ihre Antwort die richtige ist, aber ich werde dem Autor ein paar Tage Zeit geben, um sicherzugehen, bevor er sie akzeptiert.
user603

1
Ich habe keine Antwort vom Autor erhalten, aber die oben dargestellten Argumente (in der Antwort und im Kommentar) haben mich überzeugt, dass dies tatsächlich die richtige Interpretation des Problems sein muss.
Benutzer603
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.