Wie kann gezeigt werden, dass eine ausreichende Statistik NICHT minimal ausreichend ist?


8

Mein Hausaufgabenproblem besteht darin, ein Gegenbeispiel zu geben, bei dem eine bestimmte Statistik im Allgemeinen nicht minimal ausreichend ist. Unabhängig von den Einzelheiten der Suche nach einem bestimmten Gegenbeispiel für diese bestimmte Statistik wirft dies für mich die folgende Frage auf:

Frage: Wie kann man die Bedingung formulieren, keine minimale ausreichende Statistik zu sein, so dass nachgewiesen werden kann, dass eine ausreichende Statistik die Bedingung erfüllt?

Bisherige Arbeit: Die Definition der minimal ausreichenden Statistik in meinem Lehrbuch (Keener, Theoretische Statistik: Themen für einen Kernkurs ) lautet wie folgt:

  • Eine Statistik ist minimal ausreichend, wenn ausreichend ist, und für jede ausreichende Statistik existiert eine Funktion so dass ae .TTT~fT=f(T~)P

Beachten Sie, dass (ae ) bedeutet, dass die Menge, bei der die Gleichheit fehlschlägt, eine Nullmenge für jede Wahrscheinlichkeitsverteilung im statistischen Modell , .PPPPP

Beim Versuch, dies zu negieren, komme ich zu:

  • Eine Statistik ist nicht minimal ausreichend, wenn mindestens eine der folgenden Aussagen zutrifft: T
    1. T ist nicht ausreichend.
    2. Es gibt mindestens eine ausreichende Statistik für die es keine Funktion so dassT~fT=f(T~) aeP .

Also , wenn eine Statistik ist ausreichend, so scheint es , wie wäre es äußerst schwierig , zu zeigen , dass es nicht ausreichend ist , minimal, auch wenn es nicht minimal ausreichend ist. (Weil man 2. statt 1. zeigen müsste, da 1. falsch ist - aber 2. wäre sehr schwer zu zeigen, denn selbst wenn man eine Gegenbeispielstatistik im Sinn hat, muss man immer noch das zeigen Nichtexistenz einer Funktion mit dieser Eigenschaft. Und Nichtexistenz ist oft schwer nachzuweisen.)T~

Mein Lehrbuch enthält keine äquivalenten (dh notwendigen und ausreichenden) Bedingungen dafür, dass eine Statistik eine minimal ausreichende Statistik ist. Es gibt nicht einmal alternative notwendige Bedingungen für eine Statistik, die minimal ausreichend ist (abgesehen davon, dass sie eine ausreichende Statistik ist).

Wenn ich für mein Hausaufgabenproblem nicht zeigen kann, dass die Statistik nicht ausreicht (weil sie es ist), wie könnte ich dann jemals möglicherweise zeigen, dass sie nicht minimal ausreicht?


3
Haben Sie darüber nachgedacht, mit einer minimal ausreichenden Statistik zu beginnen und diese dann um weitere Komponenten zu erweitern?
whuber

3
In der Mathematik im Allgemeinen beweist man oft die Nichtexistenz von etwas, indem man annimmt, dass es existiert, und es verwendet, um eine Kontraktion zu finden.
Kodiologe

2
Eine Statistik ist eine vektorwertige Funktion der Daten. Es hat Komponenten. Eine minimal ausreichende Statistik für die Normalverteilungsfamilie ist beispielsweise der Zwei-Vektor, der aus dem Stichprobenmittelwert und der Stichprobenvarianz besteht. Wenn Sie weitere Komponenten hinzufügen, z. B. die Schiefe der Probe und die Kurtosis, erhalten Sie eine Statistik mit vier Komponenten. Mein Hinweis hat lediglich das Offensichtliche gesagt: Diese neue Statistik ist offensichtlich ausreichend, da die ersten beiden Komponenten bereits ausreichen. Aber ist es minimal ausreichend?
whuber

2
Ich sehe nicht ein, wie eine dieser Beobachtungen über Bijektionen oder Homöomorphismen möglicherweise relevant sein könnte. Verwenden Sie eine ungewöhnliche Definition von "Statistik" oder "ausreichend"?
whuber

3
Sie scheinen eine unkonventionelle Definition von Suffizienz zu verwenden. In meinem Beispiel kommt es nur darauf an, dass die neuen Statistiken echte Statistiken sind - messbare Funktionen der Daten. Die Karte von bis R 2 (die die beiden ursprünglichen Statistiken abruft, die minimal ausreichende) ist messbar (tatsächlich differenzierbar). Das ist alles was Sie überprüfen müssen. R4R2
whuber

Antworten:


1

Wie Sie sagten:

Wenn x1,x2X so dass f(x1)=f(x2) aber g(x1)g(x2) , dann kann g nicht als Funktion von f , dh dort existiert keine Funktion h mit g=hf .

So zum Beispiel in dem Fall, in dem X1,....,Xn sind unabhängige Bernoulli-Zufallsvariablen. Das können wir beweisen , (x1,....,xn) ist nicht ausreichend , um minimal zeigt , dass es nicht eine Funktion von ist , xi . Dies ist offensichtlich, da die Funktion 1 sowohl (1,0,0...,0,0,0) als auch 1 zuordnen muss(0,0,0...,0,0,1) .


2

Ich habe in letzter Zeit über dieses Problem nachgedacht, und hier ist, was ich mir ausgedacht habe.

Sei ein Wahrscheinlichkeitsraum, dann ist eine Zufallsvariable X eine messbare Funktion X : Ω X , wobei X ein messbarer Raum ist ( X hat eine bezeichnete σ- Algebra und X ist in Bezug auf diese σ- Algebra und die messbar σ- Algebra auf Ω ). Die Verteilung von X ist nur das Pullback-Maß für X , dh P X ( A ) = P Ω ( X -Ω XX:ΩXXXσXσσΩXX. Dann ist eineStatistikvonXeine beliebige messbare * Funktionf: X Y , wobei Y ein weiterer beliebiger messbarer Raum ist.PX(A)=PΩ(X1(A))Xf:XYY

Was bedeutet es bei zwei Statistiken , g : XZ , dass " g eine Funktion von f ist "?f:XYg:XZgf

Soweit ich das beurteilen kann, scheint es zu bedeuten , dass es eine messbare ** Funktion existiert , so dass g = h f , das heißt , dass g werden kann einkalkuliert durch von f .h:YZg=hfgf

(Mit anderen Worten, " muss als Funktion von f ( X ) Y gut definiert sein ".)gf(X)Y

Wann ist ein solches Factoring möglich? Denken wir an Äquivalenzbeziehungen. Definieren Sie insbesondere die Äquivalenzbeziehung auf X durch x 1 f x 2fX definieren ebenfalls die Äquivalenzbeziehungg auf X durch x 1 g x 2x1fx2f(x1)=f(x2)gX .x1gx2g(x1)=g(x2)

Damit durch f faktorisierbar ist , müssen die Äquivalenzbeziehungen f und g in dem Sinne *** kompatibel sein, dass für jedes x 1 , x 2X , x 1 f x 2 giltgffgx1,x2X , dh g kann nicht zwei Elemente nehmen, die unter f äquivalent sind,und sie Werten zuordnen, die unter g nicht äquivalent sind, dh " g kann die zuvor von f durchgeführte Informationsreduktion nicht rückgängig machen".x1fx2x1gx2gfggf

Mit anderen Worten, muss als eine Funktion auf X / ff ( X ) gut definiert sein , dh es muss eine Funktion ˜ g : X / fZ existieren, so dass g = ˜ gπ ist f , wobei π f die kanonische Projektion XX / f ist . (Für diejenigen, die sich mit abstraktem Unsinn nicht wohl fühlen, ist π f im Wesentlichen f undgX/ff(X)g~:X/fZg=g~πfπfXX/fπff ist im wesentlichenh. Die obige Formulierung macht nur Analogien zu anderen Situationen klarer.)g~h

In einfachsten möglichen Worten kann als Funktion geschrieben werden f , wenn und nur wenn für jeden x 1 , x 2X , f ( x 1 ) = f ( x 2 )gfx1,x2X .f(x1)=f(x2)g(x1)=g(x2)

Nehmen wir zum Beispiel und X eine beliebige reelle Zufallsvariable, dann kann g : x x 2 als Funktion von f : x x geschrieben werden , aber nicht umgekehrt, weil x 1 = x 2X=Y=Z=RXg:xx2f:xx , aber 1 2 = ( - 1 ) 2 aber 1 - 1 .x1=x2x12=x2212=(1)211

Nehmen wir insbesondere an, dass jede Äquivalenzklasse unter ein Singleton ist (dh f ist injektiv ). Dann kann g immer als Funktion von f geschrieben werden , da X / fX , dh f ( x 1 ) = f ( x 2 )ffgfX/fX bedeutet, dass x 1 = x 2 istf(x1)=f(x2)x1=x2 (im Allgemeinen gilt für nicht notwendigerweise injektives f nur eine Richtung), so dass unser Zustand x 1 = x 2 wirdx1=x2f(x1)=f(x2)f , was fürjedes g : XZ trivial erfüllt ist. (Um h zu definieren, kann es auf Yf ( X ) alles tun, was es will,solange es messbar ist, und dann für jedes y f ( X ) , dh so, dass y = f ( x ) für einige x X ist , definiere h als hx1=x2g(x1)=g(x2) g:XZhYf(X)yf(X)y=f(x)xXh . Dies ist gut definiert, wenn f injektiv ist, da es eineindeutiges x X gibt, so dass f ( x ) = y ist . Allgemeiner wird dies nur definiert, wenn g ( x ) unabhängig davon, welches x wir in f - 1 ( y ) wählen,immer noch der gleiche Wert ist, dh f ( x 1 ) = fh:y=f(x)g(x)f xXf(x)=yxf1(y)g(x) .)f(x1)=f(x2) (=y)g(x1)=g(x2)

Wenn man sich Satz 3.11 in Keener ansieht, ist seine Aussage etwas klobig, aber wenn man in den obigen Begriffen denkt, glaube ich, dass sie wie folgt umgeschrieben werden kann:

Angenommen, ist eine ausreichende Statistik ****. Dann ist eine ausreichende Bedingung, damit T minimal ausreichend ist, dass es als Funktion des Wahrscheinlichkeitsverhältnisses geschrieben werden kann.TT

Daraus wird sofort klar, dass das Wahrscheinlichkeitsverhältnis selbst minimal ausreichend sein muss.

Dies führt auch zu dem Schluss, dass:

Wenn so dass f ( x 1 ) = f ( x 2 ), aber g ( x 1 ) g ( x 2 ) , dann kann g nicht als Funktion von f geschrieben werden , dh dort existiert keine Funktion h mit g = h f .x1,x2Xf(x1)=f(x2)g(x1)g(x2)gfhg=hf

Daher ist der Zustand nicht so schwer zu zeigen, wie ich gedacht hatte.


* Keener geht nicht auf die Frage ein, ob eine Statistik eine messbare oder nur eine willkürliche Funktion sein muss oder nicht. Aber ich bin ziemlich sicher , dass eine Statistik hat eine messbare Funktion sein, denn sonst könnten wir nicht eine Verteilung für sie definieren , dh eine Pullback Maßnahme.

hfghf(X)Yhf(X)Yh|f(X)f(X)zYf(X)zZf(X)Yf(X)YhY

gffgYZ

T


1
Wie definieren Sie das Wahrscheinlichkeitsverhältnis?
Xi'an

@ Xi'an Ich erinnere mich nicht wirklich an all die dummen Sachen, die ich oben geschrieben habe. Um ehrlich zu sein, bin ich mir nicht sicher, auf welchen Teil du dich beziehst. Wenn Sie implizit vorschlagen, dass ich zuerst beweise, dass die Likelihood-Ratio-Statistik minimal ausreichend ist, und dann jeden anderen Beweis für eine minimale Suffizienz auf eine geeignete "Suffizienz-Äquivalenz" mit der Likelihood-Ratio-Statistik reduzieren, ist dies in der Praxis wahrscheinlich hilfreich, aber zumindest theoretisch scheint nur die Dose die Straße
runterzutreten
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.