Ich habe in letzter Zeit über dieses Problem nachgedacht, und hier ist, was ich mir ausgedacht habe.
Sei ein Wahrscheinlichkeitsraum, dann ist eine Zufallsvariable X eine messbare Funktion X : Ω → X , wobei X ein messbarer Raum ist ( X hat eine bezeichnete σ- Algebra und X ist in Bezug auf diese σ- Algebra und die messbar σ- Algebra auf Ω ). Die Verteilung von X ist nur das Pullback-Maß für X , dh P X ( A ) = P Ω ( X -Ω XX:Ω→XXXσXσσΩXX. Dann ist eineStatistikvonXeine beliebige messbare * Funktionf: X → Y , wobei Y ein weiterer beliebiger messbarer Raum ist.PX(A)=PΩ(X−1(A))Xf:X→YY
Was bedeutet es bei zwei Statistiken , g : X → Z , dass " g eine Funktion von f ist "?f:X→Yg:X→Zgf
Soweit ich das beurteilen kann, scheint es zu bedeuten , dass es eine messbare ** Funktion existiert , so dass g = h ∘ f , das heißt , dass g werden kann einkalkuliert durch von f .h:Y→Zg=h∘fgf
(Mit anderen Worten, " muss als Funktion von f ( X ) ⊆ Y gut definiert sein ".)gf(X)⊆Y
Wann ist ein solches Factoring möglich? Denken wir an Äquivalenzbeziehungen. Definieren Sie insbesondere die Äquivalenzbeziehung auf X durch x 1 ∼ f x 2∼fX definieren ebenfalls die Äquivalenzbeziehung ∼ g auf X durch x 1 ∼ g x 2x1∼fx2⟺f(x1)=f(x2)∼gX .x1∼gx2⟺g(x1)=g(x2)
Damit durch f faktorisierbar ist , müssen die Äquivalenzbeziehungen ∼ f und ∼ g in dem Sinne *** kompatibel sein, dass für jedes x 1 , x 2 ∈ X , x 1 ∼ f x 2 giltgf∼f∼gx1,x2∈X , dh g kann nicht zwei Elemente nehmen, die unter f äquivalent sind,und sie Werten zuordnen, die unter g nicht äquivalent sind, dh " g kann die zuvor von f durchgeführte Informationsreduktion nicht rückgängig machen".x1∼fx2⟹x1∼gx2gfggf
Mit anderen Worten, muss als eine Funktion auf X / ∼ f ≅ f ( X ) gut definiert sein , dh es muss eine Funktion ˜ g : X / ∼ f → Z existieren, so dass g = ˜ g ∘ π ist f , wobei π f die kanonische Projektion X → X / ∼ f ist . (Für diejenigen, die sich mit abstraktem Unsinn nicht wohl fühlen, ist π f im Wesentlichen f undgX/∼f≅f(X)g~:X/∼f→Zg=g~∘πfπfX→X/∼fπff ist im wesentlichenh. Die obige Formulierung macht nur Analogien zu anderen Situationen klarer.)g~h
In einfachsten möglichen Worten kann als Funktion geschrieben werden f , wenn und nur wenn für jeden x 1 , x 2 ∈ X , f ( x 1 ) = f ( x 2 )gfx1,x2∈X .f(x1)=f(x2)⟹g(x1)=g(x2)
Nehmen wir zum Beispiel und X eine beliebige reelle Zufallsvariable, dann kann g : x ↦ x 2 als Funktion von f : x ↦ x geschrieben werden , aber nicht umgekehrt, weil x 1 = x 2X=Y=Z=RXg:x↦x2f:x↦x , aber 1 2 = ( - 1 ) 2 aber 1 ≠ - 1 .x1=x2⟹x21=x2212=(−1)21≠−1
Nehmen wir insbesondere an, dass jede Äquivalenzklasse unter ein Singleton ist (dh f ist injektiv ). Dann kann g immer als Funktion von f geschrieben werden , da X / ∼ f ≅ X , dh f ( x 1 ) = f ( x 2 )∼ffgfX/∼f≅X bedeutet, dass x 1 = x 2 istf(x1)=f(x2)⟹x1=x2 (im Allgemeinen gilt für nicht notwendigerweise injektives f nur eine Richtung), so dass unser Zustand x 1 = x 2 wirdx1=x2⟺f(x1)=f(x2)f , was fürjedes g : X → Z trivial erfüllt ist. (Um h zu definieren, kann es auf Y ∖ f ( X ) alles tun, was es will,solange es messbar ist, und dann für jedes y ∈ f ( X ) , dh so, dass y = f ( x ) für einige x ∈ X ist , definiere h als hx1=x2⟹g(x1)=g(x2) g:X→ZhY∖f(X)y∈f(X)y=f(x)x∈Xh . Dies ist gut definiert, wenn f injektiv ist, da es eineindeutiges x ∈ X gibt, so dass f ( x ) = y ist . Allgemeiner wird dies nur definiert, wenn g ( x ) unabhängig davon, welches x wir in f - 1 ( y ) wählen,immer noch der gleiche Wert ist, dh f ( x 1 ) = fh:y=f(x)↦g(x)f x∈Xf(x)=yxf−1(y)g(x) .)f(x1)=f(x2) (=y)⟹g(x1)=g(x2)
Wenn man sich Satz 3.11 in Keener ansieht, ist seine Aussage etwas klobig, aber wenn man in den obigen Begriffen denkt, glaube ich, dass sie wie folgt umgeschrieben werden kann:
Angenommen, ist eine ausreichende Statistik ****. Dann ist eine ausreichende Bedingung, damit T minimal ausreichend ist, dass es als Funktion des Wahrscheinlichkeitsverhältnisses geschrieben werden kann.TT
Daraus wird sofort klar, dass das Wahrscheinlichkeitsverhältnis selbst minimal ausreichend sein muss.
Dies führt auch zu dem Schluss, dass:
Wenn so dass f ( x 1 ) = f ( x 2 ), aber g ( x 1 ) ≠ g ( x 2 ) , dann kann g nicht als Funktion von f geschrieben werden , dh dort existiert keine Funktion h mit g = h ∘ f .x1,x2∈Xf(x1)=f(x2)g(x1)≠g(x2)gfhg=h∘f
Daher ist der Zustand nicht so schwer zu zeigen, wie ich gedacht hatte.
* Keener geht nicht auf die Frage ein, ob eine Statistik eine messbare oder nur eine willkürliche Funktion sein muss oder nicht. Aber ich bin ziemlich sicher , dass eine Statistik hat eine messbare Funktion sein, denn sonst könnten wir nicht eine Verteilung für sie definieren , dh eine Pullback Maßnahme.
hfghf(X)⊆Yhf(X)Yh|f(X)f(X)zY∖f(X)z∈Zf(X)Y∖f(X)YhY
gffgY→Z
T