Warum ist die CDF einer Probe gleichmäßig verteilt?


17

Ich lese hier gegeben , dass eine Probe aus einer stetigen Verteilung mit cdf folgt die zu korrespondierende Stichprobe einer einheitlichen Standardverteilung.X1,X2,...,XnU i = F X ( X i )FXUi=FX(Xi)

Ich habe dies mithilfe von qualitativen Simulationen in Python überprüft und konnte die Beziehung problemlos überprüfen.

import matplotlib.pyplot as plt
import scipy.stats

xs = scipy.stats.norm.rvs(5, 2, 10000)

fig, axes = plt.subplots(1, 2, figsize=(9, 3))
axes[0].hist(xs, bins=50)
axes[0].set_title("Samples")
axes[1].hist(
    scipy.stats.norm.cdf(xs, 5, 2),
    bins=50
)
axes[1].set_title("CDF(samples)")

Daraus ergibt sich die folgende Handlung:

Plot mit dem Beispiel einer Normalverteilung und dem cdf des Beispiels.

Ich kann nicht verstehen, warum das passiert. Ich gehe davon aus, dass es mit der Definition des CDF und seiner Beziehung zum PDF zu tun hat, aber mir fehlt etwas ...

Ich würde es begrüßen, wenn jemand mich auf eine Lektüre zum Thema hinweisen oder mir helfen könnte, eine gewisse Intuition zum Thema zu bekommen.

EDIT: Die CDF sieht so aus:

CDF der Stichprobenverteilung


2
Berechne die cdf von . FX(X)
Zhanxiong

2
Sie finden einen Beweis für diese Eigenschaft (für kontinuierliche rvs) in jedem Buch über Simulation, da dies die Grundlage der inversen cdf-Simulationsmethode ist.
Xi'an,

2
Versuchen Sie auch google-ing Wahrscheinlichkeitsintegral Transformation
Zachary Blumenfeld

1
@ Xi'an Es ist gut darauf hinzuweisen, dass die Schlussfolgerung nur für kontinuierliche Zufallsvariablen gilt. Manchmal wird dieses Ergebnis fälschlicherweise für diskrete Zufallsvariablen verwendet. Andererseits ist auch zu beachten, dass viele Beweise den Schritt in dem die strenge Monotonie von , die auch ist eine zu starke Annahme. Der folgende Link bietet eine genaue Zusammenfassung zu diesem Thema: people.math.ethz.ch/~embrecht/ftp/generalized_inverse.pdfFP(F(X)x)=P(XF1(x))F
Zhanxiong

@ Zhanxiong Die einzige Bedingung, die für erforderlich ist, ist, dass es càdlàg ist. F
AdamO

Antworten:


19

Angenommen, ist stetig und nimmt zu. Definieren Sie Z = F X ( X ) und beachten Sie, dass Z Werte in [ 0 , 1 ] annimmt . Dann ist F Z ( x ) = P ( F X ( X ) x ) = P ( X F - 1 X ( x ) ) = F X ( F -FXZ=FX(X)Z[0,1]

FZ(x)=P(FX(X)x)=P(XFX1(x))=FX(FX1(x))=x.

Wenn andererseits eine einheitliche Zufallsvariable ist, die Werte in [ 0 , 1 ] annimmt , ist F U ( x ) = R f U ( u )U[0,1]

FU(x)=RfU(u)du=0xdu=x.

FZ(x)=FU(x)x[0,1]


Folgt daraus, dass Z eine gleichmäßige (0, 1) Verteilung hat?
StatsSorceress

8

F(x)F(x)FxF1x=F1(p)xpFF-1=λF-1F

Fein<bP(F-1(ein)<x<F-1(b))=P(ein<F(X)<b)=b-ein


Y.=F(X)
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.