Probenverteilung aus zwei unabhängigen Bernoulli-Populationen

Nehmen wir an, wir haben Stichproben von zwei unabhängigen Bernoulli-Zufallsvariablen, und . $\mathrm{Ber}(\theta_1)$ $\mathrm{Ber}(\theta_2)$

Wie beweisen wir, dass ?

\frac{({\bar{X}}_{1} - {\bar{X}}_{2}) - (θ_{1} - θ_{2})}{\sqrt{\frac{θ_{1} (1 - θ_{1})}{n_{1}} + \frac{θ_{2} (1 - θ_{2})}{n_{2}}}} \overset{d}{\to} N (0, 1)

$\frac{(\bar X_1-\bar X_2)-(\theta_1-\theta_2)}{\sqrt{\frac{\theta_1(1-\theta_1)}{n_1}+\frac{\theta_2(1-\theta_2)}{n_2}}}\xrightarrow{d} \mathcal N(0,1)$

Angenommen, . $n_1\neq n_2$

distributions sampling bernoulli-distribution

— Ein alter Mann im Meer.
quelle

Z_i = X_1i - X_2i ist eine Folge von iid rv von endlichem Mittelwert und Varianz. Damit erfüllt es den zentralen Grenzwertsatz von Levy-Linderberg, aus dem Ihre Ergebnisse folgen. Oder fordern Sie einen Nachweis über das CLT selbst an?

— Drei Tage,

@ThreeDiag Wie wenden Sie die LL-Version des CLT an? Ich denke nicht, dass das richtig ist. Schreiben Sie mir eine Antwort, um die Details zu überprüfen.

— Ein alter Mann im Meer.

Alle Details sind schon da. Für die Anwendung von LL benötigen Sie eine Folge von iid rv mit endlichem Mittelwert und Varianz. Die Variablen Z_i = X_i1 und X_i2 erfüllen alle drei Anforderungen. Die Unabhängigkeit ergibt sich aus der Unabhängigkeit der beiden ursprünglichen Bernoulli-Vars, und Sie können sehen, dass E (Z_i) und V (Z_i) endlich sind, indem Sie die Standardeigenschaften von E und V anwenden

— Three Diag

"Stichproben zweier unabhängiger Bernoulli-Zufallsvariablen" - falscher Ausdruck. Muss sein: "zwei unabhängige Samples aus Bernoulli-Distributionen".

— Viktor

Bitte fügen Sie "als

" hinzu.

n_{1}, n_{2} \to \infty

$n_1,n_2\to \infty$

— Viktor

Antworten:

Setzen Sie , $a=\frac{\sqrt{\theta_1(1-\theta_1)}}{\sqrt{n_1}}$ , , . Wir haben . In Bezug auf charakteristische Funktionen bedeutet dies $b=\frac{\sqrt{\theta_2(1-\theta_2)}}{\sqrt{n_2}}$ $A=(\bar{X}_1-\theta_1)/a$ $B=(\bar{X}_2-\theta_2)/b$ $A\to_d N(0,1),\ B\to_d N(0,1)$ Wir wollen beweisen, dass

ϕ_{EIN} (t) \equiv E e^{ich t EIN} \to e^{- t^{2} / 2}, ϕ_{B} (t) \to e^{- t^{2} / 2} .

$\phi_A(t)\equiv {\bf E}e^{itA}\to e^{-t^2/2},\ \phi_B(t)\to e^{-t^2/2}.$

D : = \frac{ein}{\sqrt{{ein}^{2} + b^{2}}} EIN - \frac{b}{\sqrt{{ein}^{2} + b^{2}}} B \to_{d} N (0, 1)

$D:=\frac{a}{\sqrt{a^2+b^2}}A-\frac{b}{\sqrt{a^2+b^2}}B\to_d N(0,1)$

Da und unabhängig sind, ist $A$ $B$ wie wir es sein wollen.

ϕ_{D} (t) = ϕ_{EIN} (\frac{ein}{\sqrt{{ein}^{2} + b^{2}}} t) ϕ_{B} (- \frac{b}{\sqrt{{ein}^{2} + b^{2}}} t) \to e^{- t^{2} / 2},

$\phi_D(t)=\phi_A\left(\frac{a}{\sqrt{a^2+b^2}}t\right)\phi_B\left(-\frac{b}{\sqrt{a^2+b^2}}t\right)\to e^{-t^2/2},$

Dieser Beweis ist unvollständig. Hier brauchen wir einige Schätzungen für die gleichmäßige Konvergenz der charakteristischen Funktionen. Im vorliegenden Fall können wir jedoch explizite Berechnungen durchführen. Setze . $p=\theta_1,\ m=n_1$ als. Somit kann für eine feste,

\begin{aligned} ϕ_{X_{1, 1}} (t) & = 1 + p (e^{ich t} - 1), \\ ϕ_{{\bar{X}}_{1}} (t) & = (1 + p (e^{ich t / m} - 1))^{m}, \\ ϕ_{{\bar{X}}_{1} - θ_{1}} (t) & = (1 + p (e^{ich t / m} - 1))^{m} e^{- ich p t}, \\ ϕ_{EIN} (t) & = (1 + p (e^{ich t / \sqrt{m p (1 - p)}} - 1))^{m} e^{- ich p t \sqrt{m} / \sqrt{p (1 - p)}} \\ = {((1 + p (e^{ich t / \sqrt{m p (1 - p)}} - 1)) e^{- ich p t / \sqrt{m p (1 - p)}})}^{m} \\ = {(1 - \frac{t^{2}}{2 m} + Ö (t^{3} m^{- 3 / 2}))}^{m} \end{aligned}

$\begin{align} \phi_{X_{1,1}}(t) &= 1+p(e^{it}-1), \\ \phi_{\bar X_{1}}(t) &= (1+p(e^{it/m}-1))^m, \\ \phi_{\bar X_{1}-\theta_1}(t) &= (1+p(e^{it/m}-1))^m e^{-ipt}, \\ \phi_{A}(t) &= (1+p(e^{it/\sqrt{mp(1-p)}}-1))^m e^{-ipt\sqrt{m}/\sqrt{p(1-p)}} \\[5pt] &= \left( \left(1+p(e^{it/\sqrt{mp(1-p)}}-1)\right)e^{-ipt/\sqrt{mp(1-p)}}\right)^m \\[5pt] &=\left( 1-\frac{t^2}{2m}+O(t^3m^{-3/2}) \right)^m \end{align}$

t^{3} m^{- 3 / 2} \to 0

$t^3m^{-3/2}\to 0$

t

$t$

(auch wenn

oder

), da

ϕ_{D} (t) = {(1 - \frac{{ein}^{2} t^{2}}{2 ({ein}^{2} + b^{2}) n_{1}} + Ö (n_{1}^{- 3 / 2}))}^{n_{1}} {(1 - \frac{b^{2} t^{2}}{2 ({ein}^{2} + b^{2}) n_{2}} + Ö (n_{2}^{- 3 / 2}))}^{n_{2}} \to e^{- t^{2} / 2}

$\phi_D(t)=\left( 1-\frac{a^2t^2}{2(a^2+b^2)n_1}+O(n_1^{-3/2}) \right)^{n_1} \left( 1-\frac{b^2t^2}{2(a^2+b^2)n_2}+O(n_2^{-3/2}) \right)^{n_2} \to e^{-t^2/2}$

a \to 0

$a\to 0$

b \to 0

$b\to 0$

| e^{- y} - (1 - y / m)^{m} | \leq y^{2} / 2 m

$\left|e^{-y}-(1-y/m)^m\right|\le {y^2}/{2m}\$ wenn

(siehe /math/2566469/uniform-bounds-for-1-y-nn-exp-y/ ).

y / m < 1 / 2

$\ y/m<1/2$

Es ist zu beachten, dass ähnliche Berechnungen für beliebige (nicht notwendigerweise Bernoulli) Verteilungen mit endlichen zweiten Momenten unter Verwendung der Erweiterung der charakteristischen Funktion in Bezug auf die ersten beiden Momente durchgeführt werden können.

— Viktor
quelle

Das scheint richtig zu sein. Ich melde mich später wieder, wenn ich Zeit habe, alles zu überprüfen. ;)

— Ein alter Mann im Meer.

-1

Der Beweis Ihrer Aussage ist gleichbedeutend mit dem Beweis des (Levy-Lindenberg-) zentralen Grenzwertsatzes, der besagt

$\{Z_i\}_{i=1}^n$ $\mathbb{E}(Z_i) = \mu$ $\mathbb{V}(Z_i) = \sigma^2$

\sqrt{n} (\bar{Z} - μ) \to^{d} N (0, σ^{2})

$\sqrt{n}(\bar{Z} - \mu) \to^d N(0,\sigma^2)$

$\bar{Z} = \sum_i Z_i/n$

Dann ist es leicht zu sehen, wenn wir setzen

Z_{ich} = X_{1} ich - X_{2} ich

$Z_i = X_1i - X_2i$

X_{1 i}, X_{2 i}

$X_{1i}, X_{2i}$

B e r (θ_{1})

$Ber(\theta_1)$

B e r (θ_{2})

$Ber(\theta_2)$

E (Z_{ich}) = θ_{1} - θ_{2} = μ

$\mathbb{E}(Z_i) = \theta_1 - \theta_2 = \mu$

und

V (Z_{ich}) = θ_{1} (1 - θ_{1}) + θ_{2} (1 - θ_{2}) = σ^{2}

$\mathbb{V}(Z_i)= \theta_1(1-\theta_1) +\theta_2(1-\theta_2)= \sigma^2$

$n_1 \neq n_2$

— Drei Diag
quelle

n_{1} \neq n_{2}

$n_1\neq n_2$

Ich werde es später zeigen, wenn Sie es nicht bekommen können. Hinweis: Berechnen Sie die Varianz des Stichprobenmittelwerts von Z und verwenden Sie diese als Variable im Theorem

— Drei Tage,

n_{1} \neq n_{2}

$n_1 \neq n_2$

Werde so schnell wie möglich ein wenig timr finden. Es gab tatsächlich eine Feinheit, die die Verwendung von LL clt ohne Anpassung verhinderte. Es gibt drei Möglichkeiten, von denen die einfachste darin besteht, dass für große n1 und n2 X1 und X2 in der Verteilung auf Normalen gehen, dann ist auch eine lineare Kombination von Normal normal. Dies ist eine Eigenschaft von Normalen, die Sie als gegeben annehmen können, andernfalls können Sie dies durch charakteristische Funktionen beweisen.

— Drei Tage,

Die anderen beiden benötigen entweder einen anderen CLT (Lyapunov möglicherweise) oder behandeln alternativ n1 = i und n2 = i + k. Dann für große i können Sie im Wesentlichen k ignorieren und Sie können zurückgehen, um LL anzuwenden (aber es wird noch etwas Sorgfalt erfordern, um die richtige Varianz zu nageln)

— Drei Diag