Reproduzieren Sie die Figur der "Computer Age Statistical Inference" von Efron und Hastie

Die zusammengefasste Version meiner Frage

(26. Dezember 2018)

Ich versuche, Abbildung 2.2 aus Computer Age Statistical Inference von Efron und Hastie zu reproduzieren , aber aus irgendeinem Grund, den ich nicht verstehen kann, stimmen die Zahlen nicht mit denen im Buch überein.

Angenommen, wir versuchen, zwischen zwei möglichen Wahrscheinlichkeitsdichtefunktionen für die beobachteten Daten , einer Nullhypothesendichte und einer alternativen Dichte . Eine Testregel besagt, welche Wahl, oder , wir treffen werden, wenn wir die Daten beobachtet haben . Jede solche Regel weist zwei häufig auftretende Fehlerwahrscheinlichkeiten auf: Auswahl von wenn tatsächlich generiert hat , und umgekehrt; $x$ $f_0\left(x\right)$ $f_1\left(x\right)$ $t\left(x\right)$ $0$ $1$ $x$ $f_1$ $f_0$ $x$

α = {Pr}_{f_{0}} {t (x) = 1},

$\alpha = \text{Pr}_{f_0} \{t(x)=1\},$

β = {Pr}_{f_{1}} {t (x) = 0} .

$\beta = \text{Pr}_{f_1} \{t(x)=0\}.$

Sei das Wahrscheinlichkeitsverhältnis , $L(x)$

L (x) = \frac{f_{1} (x)}{f_{0} (x)}

$L(x) = \frac{f_1\left(x\right)}{f_0\left(x\right)}$

Das Neyman-Pearson-Lemma besagt also, dass die der Form der optimale Algorithmus zum Testen von Hypothesen ist $t_c(x)$

t_{c} (x) = {\begin{cases} 1 if log L (x) \geq c \\ 0 if log L (x) < c . \end{cases}

$t_c(x) = \left\{ \begin{array}{ll} 1\enspace\text{if log } L(x) \ge c\\ 0\enspace\text{if log } L(x) \lt c.\end{array} \right.$

Für und die Stichprobengröße wären die Werte für und für einen Cutoff ? $f_0 \sim \mathcal{N} \left(0,1\right), \enspace f_1 \sim \mathcal{N} \left(0.5,1\right)$ $n=10$ $\alpha$ $\beta$ $c=0.4$

Aus Abbildung 2.2 der statistischen Inferenz des Computerzeitalters von Efron und Hastie haben wir:
- $\alpha=0.10$ und für einen Cutoff $\beta=0.38$ $c=0.4$
Ich fand und für einen Cutoff Verwendung von zwei verschiedenen Ansätzen: A) Simulation und B) analytisch . $\alpha=0.15$ $\beta=0.30$ $c=0.4$

Ich würde mich freuen, wenn mir jemand erklären könnte, wie man und für einen Cutoff erhält . Vielen Dank. $\alpha=0.10$ $\beta=0.38$ $c=0.4$

Die zusammengefasste Version meiner Frage endet hier. Ab sofort finden Sie:

In Abschnitt A) Details und vollständiger Python-Code meines Simulationsansatzes .
In Abschnitt B) Details und vollständiger Python-Code des analytischen Ansatzes.

A) Mein Simulationsansatz mit vollständigem Python-Code und Erklärungen

(20. Dezember 2018)

Von dem Buch ...

In diesem Sinne bietet das Neyman-Pearson-Lemma einen optimalen Algorithmus zum Testen von Hypothesen. Dies ist vielleicht die eleganteste der frequentistischen Konstruktionen. In seiner einfachsten Formulierung geht das NP-Lemma davon aus, dass wir versuchen, zwischen zwei möglichen Wahrscheinlichkeitsdichtefunktionen für die beobachteten Daten , einer Nullhypothesendichte und einer alternativen Dichte . Eine Testregel besagt, welche Wahl, oder , wir treffen werden, wenn wir die Daten beobachtet haben . Jede solche Regel weist zwei häufig auftretende Fehlerwahrscheinlichkeiten auf: Auswahl von wenn tatsächlich generiert wird $x$ $f_0\left(x\right)$ $f_1\left(x\right)$ $t\left(x\right)$ $0$ $1$ $x$ $f_1$ und umgekehrt

$α = {Pr}_{f_{0}} {t (x) = 1}},$ $\alpha = \text{Pr}_{f_0} \{t(x)=1\},$ $β = {Pr}_{f_{1}} {t (x) = 0}} .$ $\beta = \text{Pr}_{f_1} \{t(x)=0\}.$

Sei das Wahrscheinlichkeitsverhältnis , $L(x)$

$L. (x) = \frac{f_{1} (x)}{f_{0} (x)}$ $L(x) = \frac{f_1\left(x\right)}{f_0\left(x\right)}$

(Quelle: Efron, B. & Hastie, T. (2016). Statistische Inferenz des Computerzeitalters: Algorithmen, Evidenz und Datenwissenschaft. Cambridge: Cambridge University Press. )

Also habe ich den folgenden Python-Code implementiert ...

import numpy as np

def likelihood_ratio(x, f1_density, f0_density):
    return np.prod(f1_density.pdf(x)) / np.prod(f0_density.pdf(x))

Wieder aus dem Buch ...

und definiere die durch

$t_{c} (x) = {\begin{cases} 1 wenn log L. (x) \geq c \\ 0 wenn log L. (x) < c . \end{cases}$ $t_c(x) = \left\{ \begin{array}{ll} 1\enspace\text{if log } L(x) \ge c\\ 0\enspace\text{if log } L(x) \lt c.\end{array} \right.$

(Quelle: Efron, B. & Hastie, T. (2016). Statistische Inferenz des Computerzeitalters: Algorithmen, Evidenz und Datenwissenschaft. Cambridge: Cambridge University Press. )

Also habe ich den folgenden Python-Code implementiert ...

def Neyman_Pearson_testing_rule(x, cutoff, f0_density, f1_density):
    lr = likelihood_ratio(x, f1_density, f0_density)
    llr = np.log(lr)

    if llr >= cutoff:
        return 1
    else:
        return 0

Zum Schluss aus dem Buch ...

Wo man schließen kann, dass ein Cutoff und impliziert . $c=0.4$ $\alpha=0.10$ $\beta=0.38$

Also habe ich den folgenden Python-Code implementiert ...

def alpha_simulation(cutoff, f0_density, f1_density, sample_size, replicates):
    NP_test_results = []

    for _ in range(replicates):
        x = f0_density.rvs(size=sample_size)
        test = Neyman_Pearson_testing_rule(x, cutoff, f0_density, f1_density)
        NP_test_results.append(test)

    return np.sum(NP_test_results) / float(replicates)

def beta_simulation(cutoff, f0_density, f1_density, sample_size, replicates):
    NP_test_results = []

    for _ in range(replicates):
        x = f1_density.rvs(size=sample_size)
        test = Neyman_Pearson_testing_rule(x, cutoff, f0_density, f1_density)
        NP_test_results.append(test)

    return (replicates - np.sum(NP_test_results)) / float(replicates)

und der Code ...

from scipy import stats as st

f0_density = st.norm(loc=0, scale=1)
f1_density = st.norm(loc=0.5, scale=1)

sample_size = 10
replicates = 12000

cutoffs = []
alphas_simulated = []
betas_simulated = []
for cutoff in np.arange(3.2, -3.6, -0.4):
    alpha_ = alpha_simulation(cutoff, f0_density, f1_density, sample_size, replicates)
    beta_ = beta_simulation(cutoff, f0_density, f1_density, sample_size, replicates)

    cutoffs.append(cutoff)
    alphas_simulated.append(alpha_)
    betas_simulated.append(beta_)

und der Code ...

import matplotlib.pyplot as plt
%matplotlib inline

# Reproducing Figure 2.2 from simulation results.
plt.xlabel('$\\alpha$')
plt.ylabel('$\\beta$')
plt.xlim(-0.1, 1.05)
plt.ylim(-0.1, 1.05)
plt.axvline(x=0, color='b', linestyle='--')
plt.axvline(x=1, color='b', linestyle='--')
plt.axhline(y=0, color='b', linestyle='--')
plt.axhline(y=1, color='b', linestyle='--')
figure_2_2 = plt.plot(alphas_simulated, betas_simulated, 'ro', alphas_simulated, betas_simulated, 'k-')

um so etwas zu erhalten:

das sieht ähnlich aus wie die ursprüngliche Figur aus dem Buch, aber die 3-Tupel aus meiner Simulation haben unterschiedliche Werte von und im Vergleich zu denen des Buches für denselben Cutoff . Zum Beispiel: $(c,\alpha,\beta)$ $\alpha$ $\beta$ $c$

aus dem Buch, das wir haben $(c=0.4, \alpha=0.10, \beta=0.38)$
Aus meiner Simulation haben wir:
- $(c=0.4, \alpha=0.15, \beta=0.30)$
- $(c=0.8, \alpha=0.10, \beta=0.39)$

Es scheint, dass der Cutoff aus meiner Simulation dem Cutoff aus dem Buch entspricht. $c=0.8$ $c=0.4$

Ich würde mich freuen, wenn mir jemand erklären könnte, was ich hier falsch mache. Vielen Dank.

B) Mein Berechnungsansatz mit vollständigem Python-Code und Erklärungen

(26. Dezember 2018)

alpha_simulation(.), beta_simulation(.)Wir haben immer noch versucht, den Unterschied zwischen den Ergebnissen meiner Simulation ( ) und den im Buch vorgestellten zu verstehen. Mit Hilfe eines Freundes von mir (Sofia) haben wir und analytisch berechnet, anstatt über Simulation. . $\alpha$ $\beta$

Einmal das

f_{0} \sim N. (0, 1)

$f_0 \sim \mathcal{N} \left(0,1\right)$

f_{1} \sim N. (0,5, 1)

$f_1 \sim \mathcal{N} \left(0.5,1\right)$

dann

f (x | μ, σ^{2}) = \prod_{ich = 1}^{n} \frac{1}{\sqrt{2 π σ^{2}}} e^{- - \frac{{(x_{ich} - - μ)}^{2}}{2 σ^{2}}}

$f\left(x \;\middle\vert\; \mu, \sigma^2 \right) = \prod_{i = 1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{\left(x_i-\mu\right)^2}{2\sigma^2}}$

Außerdem,

L. (x) = \frac{f_{1} (x)}{f_{0} (x)}

$L(x) = \frac{f_1\left(x\right)}{f_0\left(x\right)}$

damit,

L. (x) = \frac{f_{1} (x | μ_{1}, σ^{2})}{f_{0} (x | μ_{0}, σ^{2})} = \frac{\prod_{ich = 1}^{n} \frac{1}{\sqrt{2 π σ^{2}}} e^{- - \frac{{(x_{ich} - - μ_{1})}^{2}}{2 σ^{2}}}}{\prod_{ich = 1}^{n} \frac{1}{\sqrt{2 π σ^{2}}} e^{- - \frac{{(x_{ich} - - μ_{0})}^{2}}{2 σ^{2}}}}

$L(x) = \frac{f_1\left(x\;\middle\vert\; \mu_1, \sigma^2\right)}{f_0\left(x\;\middle\vert\; \mu_0, \sigma^2\right)} = \frac{\prod_{i = 1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{\left(x_i-\mu_1\right)^2}{2\sigma^2}}}{\prod_{i = 1}^{n} \frac{1}{\sqrt{2\pi\sigma^2}}e^{-\frac{\left(x_i-\mu_0\right)^2}{2\sigma^2}}}$

Wenn wir also einige algebraische Vereinfachungen durchführen (wie unten), haben wir:

L. (x) = \frac{{(\frac{1}{\sqrt{2 π σ^{2}}})}^{n} e^{- - \frac{\sum_{ich = 1}^{n} {(x_{ich} - - μ_{1})}^{2}}{2 σ^{2}}}}{{(\frac{1}{\sqrt{2 π σ^{2}}})}^{n} e^{- - \frac{\sum_{ich = 1}^{n} {(x_{ich} - - μ_{0})}^{2}}{2 σ^{2}}}}

$L(x) = \frac{\left(\frac{1}{\sqrt{2\pi\sigma^2}}\right)^n e^{-\frac{\sum_{i = 1}^{n} \left(x_i-\mu_1\right)^2}{2\sigma^2}}}{\left(\frac{1}{\sqrt{2\pi\sigma^2}}\right)^n e^{-\frac{\sum_{i = 1}^{n} \left(x_i-\mu_0\right)^2}{2\sigma^2}}}$

= e^{\frac{- - \sum_{ich = 1}^{n} {(x_{ich} - - μ_{1})}^{2} + \sum_{ich = 1}^{n} {(x_{ich} - - μ_{0})}^{2}}{2 σ^{2}}}

$= e^{\frac{-\sum_{i = 1}^{n} \left(x_i-\mu_1\right)^2 + \sum_{i = 1}^{n} \left(x_i-\mu_0\right)^2}{2\sigma^2}}$

= e^{\frac{- - \sum_{ich = 1}^{n} (x_{ich}^{2} - - 2 x_{ich} μ_{1} + μ_{1}^{2}) + \sum_{ich = 1}^{n} (x_{ich}^{2} - - 2 x_{ich} μ_{0} + μ_{0}^{2})}{2 σ^{2}}}

$= e^{\frac{-\sum_{i = 1}^{n} \left(x_i^2 -2x_i\mu_1 + \mu_1^2\right) + \sum_{i = 1}^{n} \left(x_i^2 -2x_i\mu_0 + \mu_0^2\right)}{2\sigma^2}}$

= e^{\frac{- - \sum_{ich = 1}^{n} x_{ich}^{2} + 2 μ_{1} \sum_{ich = 1}^{n} x_{ich} - - \sum_{ich = 1}^{n} μ_{1}^{2} + \sum_{ich = 1}^{n} x_{ich}^{2} - - 2 μ_{0} \sum_{ich = 1}^{n} x_{ich} + \sum_{ich = 1}^{n} μ_{0}^{2}}{2 σ^{2}}}

$= e^{\frac{-\sum_{i = 1}^{n}x_i^2 + 2\mu_1\sum_{i = 1}^{n}x_i - \sum_{i = 1}^{n}\mu_1^2 + \sum_{i = 1}^{n}x_i^2 - 2\mu_0\sum_{i = 1}^{n}x_i + \sum_{i = 1}^{n}\mu_0^2}{2\sigma^2}}$

= e^{\frac{2 (μ_{1} - - μ_{0}) \sum_{ich = 1}^{n} x_{ich} + n (μ_{0}^{2} - - μ_{1}^{2})}{2 σ^{2}}}

$= e^{\frac{2\left(\mu_1-\mu_0\right)\sum_{i = 1}^{n}x_i + n\left(\mu_0^2-\mu_1^2\right)}{2\sigma^2}}$ .

Also, wenn

t_{c} (x) = {\begin{cases} 1 wenn log L. (x) \geq c \\ 0 wenn log L. (x) < c . \end{cases}

$t_c(x) = \left\{ \begin{array}{ll} 1\enspace\text{if log } L(x) \ge c\\ 0\enspace\text{if log } L(x) \lt c.\end{array} \right.$

dann haben wir für : $\text{log } L(x) \ge c$

Log (e^{\frac{2 (μ_{1} - - μ_{0}) \sum_{ich = 1}^{n} x_{ich} + n (μ_{0}^{2} - - μ_{1}^{2})}{2 σ^{2}}}) \geq c

$\text{log } \left( e^{\frac{2\left(\mu_1-\mu_0\right)\sum_{i = 1}^{n}x_i + n\left(\mu_0^2-\mu_1^2\right)}{2\sigma^2}} \right) \ge c$

\frac{2 (μ_{1} - - μ_{0}) \sum_{ich = 1}^{n} x_{ich} + n (μ_{0}^{2} - - μ_{1}^{2})}{2 σ^{2}} \geq c

$\frac{2\left(\mu_1-\mu_0\right)\sum_{i = 1}^{n}x_i + n\left(\mu_0^2-\mu_1^2\right)}{2\sigma^2} \ge c$

\sum_{ich = 1}^{n} x_{ich} \geq \frac{2 c σ^{2} - - n (μ_{0}^{2} - - μ_{1}^{2})}{2 (μ_{1} - - μ_{0})}

$\sum_{i = 1}^{n}x_i \ge \frac{2c\sigma^2 - n\left(\mu_0^2-\mu_1^2\right)}{2\left(\mu_1-\mu_0\right)}$

\sum_{ich = 1}^{n} x_{ich} \geq \frac{2 c σ^{2}}{2 (μ_{1} - - μ_{0})} - - \frac{n (μ_{0}^{2} - - μ_{1}^{2})}{2 (μ_{1} - - μ_{0})}

$\sum_{i = 1}^{n}x_i \ge \frac{2c\sigma^2}{2\left(\mu_1-\mu_0\right)} - \frac{n\left(\mu_0^2-\mu_1^2\right)}{2\left(\mu_1-\mu_0\right)}$

\sum_{ich = 1}^{n} x_{ich} \geq \frac{c σ^{2}}{(μ_{1} - - μ_{0})} - - \frac{n (μ_{0}^{2} - - μ_{1}^{2})}{2 (μ_{1} - - μ_{0})}

$\sum_{i = 1}^{n}x_i \ge \frac{c\sigma^2}{\left(\mu_1-\mu_0\right)} - \frac{n\left(\mu_0^2-\mu_1^2\right)}{2\left(\mu_1-\mu_0\right)}$

\sum_{ich = 1}^{n} x_{ich} \geq \frac{c σ^{2}}{(μ_{1} - - μ_{0})} + \frac{n (μ_{1}^{2} - - μ_{0}^{2})}{2 (μ_{1} - - μ_{0})}

$\sum_{i = 1}^{n}x_i \ge \frac{c\sigma^2}{\left(\mu_1-\mu_0\right)} + \frac{n\left(\mu_1^2-\mu_0^2\right)}{2\left(\mu_1-\mu_0\right)}$

\sum_{ich = 1}^{n} x_{ich} \geq \frac{c σ^{2}}{(μ_{1} - - μ_{0})} + \frac{n (μ_{1} - - μ_{0}) (μ_{1} + μ_{0})}{2 (μ_{1} - - μ_{0})}

$\sum_{i = 1}^{n}x_i \ge \frac{c\sigma^2}{\left(\mu_1-\mu_0\right)} + \frac{n\left(\mu_1-\mu_0\right)\left(\mu_1+\mu_0\right)}{2\left(\mu_1-\mu_0\right)}$

\sum_{ich = 1}^{n} x_{ich} \geq \frac{c σ^{2}}{(μ_{1} - - μ_{0})} + \frac{n (μ_{1} + μ_{0})}{2}

$\sum_{i = 1}^{n}x_i \ge \frac{c\sigma^2}{\left(\mu_1-\mu_0\right)} + \frac{n\left(\mu_1+\mu_0\right)}{2}$

(\frac{1}{n}) \sum_{ich = 1}^{n} x_{ich} \geq (\frac{1}{n}) (\frac{c σ^{2}}{(μ_{1} - - μ_{0})} + \frac{n (μ_{1} + μ_{0})}{2})

$\left(\frac{1}{n}\right) \sum_{i = 1}^{n}x_i \ge \left(\frac{1}{n}\right) \left( \frac{c\sigma^2}{\left(\mu_1-\mu_0\right)} + \frac{n\left(\mu_1+\mu_0\right)}{2}\right)$

\frac{\sum_{ich = 1}^{n} x_{ich}}{n} \geq \frac{c σ^{2}}{n (μ_{1} - - μ_{0})} + \frac{(μ_{1} + μ_{0})}{2}

$\frac{\sum_{i = 1}^{n}x_i}{n} \ge \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2}$

\bar{x} \geq \frac{c σ^{2}}{n (μ_{1} - - μ_{0})} + \frac{(μ_{1} + μ_{0})}{2}

$\bar{x} \ge \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2}$

\bar{x} \geq k, wo k = \frac{c σ^{2}}{n (μ_{1} - - μ_{0})} + \frac{(μ_{1} + μ_{0})}{2}

$\bar{x} \ge k \text{, where } k = \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2}$

ergebend

t_{c} (x) = {\begin{cases} 1 wenn \bar{x} \geq k \\ 0 wenn \bar{x} < k . \end{cases}, wo k = \frac{c σ^{2}}{n (μ_{1} - - μ_{0})} + \frac{(μ_{1} + μ_{0})}{2}

$t_c(x) = \left\{ \begin{array}{ll} 1\enspace\text{if } \bar{x} \ge k\\ 0\enspace\text{if } \bar{x} \lt k.\end{array} \right. \enspace \enspace \text{, where } k = \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2}$

Um und zu berechnen , wissen wir, dass: $\alpha$ $\beta$

α = {Pr}_{f_{0}} {t (x) = 1}},

$\alpha = \text{Pr}_{f_0} \{t(x)=1\},$

β = {Pr}_{f_{1}} {t (x) = 0}} .

$\beta = \text{Pr}_{f_1} \{t(x)=0\}.$

damit,

\begin{array}{ll} α = {Pr}_{f_{0}} {\bar{x} \geq k}}, \\ β = {Pr}_{f_{1}} {\bar{x} < k}} . \end{array} wo k = \frac{c σ^{2}}{n (μ_{1} - - μ_{0})} + \frac{(μ_{1} + μ_{0})}{2}

$\begin{array}{ll} \alpha = \text{Pr}_{f_0} \{\bar{x} \ge k\},\\ \beta = \text{Pr}_{f_1} \{\bar{x} \lt k\}.\end{array} \enspace \enspace \text{ where } k = \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2}$

Für ... $\alpha$

α = {Pr}_{f_{0}} {\bar{x} \geq k}} = {Pr}_{f_{0}} {\bar{x} - - μ_{0} \geq k - - μ_{0}}}

$\alpha = \text{Pr}_{f_0} \{\bar{x} \ge k\} = \text{Pr}_{f_0} \{\bar{x} - \mu_0 \ge k - \mu_0\}$

α = {Pr}_{f_{0}} {\frac{\bar{x} - - μ_{0}}{\frac{σ}{\sqrt{n}}} \geq \frac{k - - μ_{0}}{\frac{σ}{\sqrt{n}}}}}

$\alpha = \text{Pr}_{f_0} \left\{\frac{\bar{x} - \mu_0}{\frac{\sigma}{\sqrt{n}}} \ge \frac{k - \mu_0}{\frac{\sigma}{\sqrt{n}}}\right\}$

α = {Pr}_{f_{0}} {Z-Score \geq \frac{k - - μ_{0}}{\frac{σ}{\sqrt{n}}}}} wo k = \frac{c σ^{2}}{n (μ_{1} - - μ_{0})} + \frac{(μ_{1} + μ_{0})}{2}

$\alpha = \text{Pr}_{f_0} \left\{\text{z-score} \ge \frac{k - \mu_0}{\frac{\sigma}{\sqrt{n}}}\right\} \enspace \enspace \text{ where } k = \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2}$

Also habe ich den folgenden Python-Code implementiert:

def alpha_calculation(cutoff, m_0, m_1, variance, sample_size):
    c = cutoff
    n = sample_size
    sigma = np.sqrt(variance)

    k = (c*variance)/(n*(m_1-m_0)) + (m_1+m_0)/2.0

    z_alpha = (k-m_0)/(sigma/np.sqrt(n))

    # Pr{z_score >= z_alpha}
    return 1.0 - st.norm(loc=0, scale=1).cdf(z_alpha)

Für ... $\beta$

β = {Pr}_{f_{1}} {\bar{x} < k}} = {Pr}_{f_{1}} {\bar{x} - - μ_{1} < k - - μ_{1}}}

$\beta = \text{Pr}_{f_1} \{\bar{x} \lt k\} = \text{Pr}_{f_1} \{\bar{x} - \mu_1 \lt k - \mu_1\}$

β = {Pr}_{f_{1}} {\frac{\bar{x} - - μ_{1}}{\frac{σ}{\sqrt{n}}} < \frac{k - - μ_{1}}{\frac{σ}{\sqrt{n}}}}}

$\beta = \text{Pr}_{f_1} \left\{\frac{\bar{x} - \mu_1}{\frac{\sigma}{\sqrt{n}}} \lt \frac{k - \mu_1}{\frac{\sigma}{\sqrt{n}}}\right\}$

β = {Pr}_{f_{1}} {Z-Score < \frac{k - - μ_{1}}{\frac{σ}{\sqrt{n}}}}} wo k = \frac{c σ^{2}}{n (μ_{1} - - μ_{0})} + \frac{(μ_{1} + μ_{0})}{2}

$\beta = \text{Pr}_{f_1} \left\{\text{z-score} \lt \frac{k - \mu_1}{\frac{\sigma}{\sqrt{n}}}\right\} \enspace \enspace \text{ where } k = \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2}$

Daraus resultiert der folgende Python-Code:

def beta_calculation(cutoff, m_0, m_1, variance, sample_size):
    c = cutoff
    n = sample_size
    sigma = np.sqrt(variance)

    k = (c*variance)/(n*(m_1-m_0)) + (m_1+m_0)/2.0

    z_beta = (k-m_1)/(sigma/np.sqrt(n))

    # Pr{z_score < z_beta}
    return st.norm(loc=0, scale=1).cdf(z_beta)

und der Code ...

alphas_calculated = []
betas_calculated = []
for cutoff in cutoffs:
    alpha_ = alpha_calculation(cutoff, 0.0, 0.5, 1.0, sample_size)
    beta_ = beta_calculation(cutoff, 0.0, 0.5, 1.0, sample_size)

    alphas_calculated.append(alpha_)
    betas_calculated.append(beta_)

und der Code ...

# Reproducing Figure 2.2 from calculation results.
plt.xlabel('$\\alpha$')
plt.ylabel('$\\beta$')
plt.xlim(-0.1, 1.05)
plt.ylim(-0.1, 1.05)
plt.axvline(x=0, color='b', linestyle='--')
plt.axvline(x=1, color='b', linestyle='--')
plt.axhline(y=0, color='b', linestyle='--')
plt.axhline(y=1, color='b', linestyle='--')
figure_2_2 = plt.plot(alphas_calculated, betas_calculated, 'ro', alphas_calculated, betas_calculated, 'k-')

um eine Zahl und Werte für und zu erhalten, die meiner ersten Simulation sehr ähnlich sind $\alpha$ $\beta$

Und schließlich, um die Ergebnisse zwischen Simulation und Berechnung nebeneinander zu vergleichen ...

df = pd.DataFrame({
    'cutoff': np.round(cutoffs, decimals=2), 
    'simulated alpha': np.round(alphas_simulated, decimals=2),
    'simulated beta': np.round(betas_simulated, decimals=2),
    'calculated alpha': np.round(alphas_calculated, decimals=2),
    'calculate beta': np.round(betas_calculated, decimals=2)
})
df

ergebend

Dies zeigt, dass die Ergebnisse der Simulation denen des analytischen Ansatzes sehr ähnlich (wenn nicht sogar gleich) sind.

Kurz gesagt, ich brauche immer noch Hilfe, um herauszufinden, was in meinen Berechnungen falsch sein könnte. Vielen Dank. :) :)

— Francisco Fonseca
quelle

Es scheint mir, dass jede Frage, bei der die Leser 11 Seiten Computercode, statistische Ausgabe und Algebra durchblättern müssen, von niemandem gelesen werden kann, geschweige denn mit Nachdruck beantwortet wird. Wenn Sie daran interessiert sind, dies zu verfolgen, wie Sie es anscheinend aus der Zeit und Aufmerksamkeit heraus tun, die Sie dafür aufgewendet haben, kann ich Ihnen vorschlagen, den Kern der Angelegenheit zu identifizieren und zu prüfen, ob Sie sie erklären und Ihre Frage im Rahmen von stellen können eine oder höchstens zwei Seiten Material?

— whuber

Hallo @whuber, danke für deinen Vorschlag! Meine Absicht war es, Details (Quellcode und Erklärungen) zu veröffentlichen, damit jeder meine Ergebnisse reproduzieren kann, aber es scheint, dass diese Strategie nicht sehr gut funktioniert hat, wie Sie richtig beobachtet haben :). Danke nochmal. Dann habe ich die Frage bearbeitet, um meine Zweifel am Anfang des Beitrags zusammenzufassen. Ich hoffe das funktioniert.

— Francisco Fonseca

Auf der Website des Buches Computer Age Statistical Inference gibt es eine Diskussionsrunde, in der Trevor Hastie und Brad Efron häufig auf mehrere Fragen antworten. Also habe ich diese Frage dort gepostet (siehe unten) und von Trevor Hastie die Bestätigung erhalten, dass es einen Fehler in dem Buch gibt, der behoben wird (mit anderen Worten, meine Simulationen und Berechnungen - wie in Python in dieser Frage implementiert - sind korrekt ).

Wenn Trevor Hastie die geantwortet „Tatsächlich c = .75 für den plot“ bedeutet , dass zu der unteren Abbildung (ursprüngliche Bild 2.2 aus dem Buch) die Grenz sollte anstelle von : $c$ $c=0.75$ $c=0.4$

Also, meine Funktionen alpha_simulation(.), beta_simulation(.), alpha_calculation(.)und beta_calculation(.)(das der volle Python - Code ist in dieser Frage zur Verfügung) Ich habe und für einen Cutoff als Bestätigung , dass mein Code korrekt ist. $\alpha=0.10$ $\beta=0.38$ $c=0.75$

alpha_simulated_c075 = alpha_simulation(0.75, f0_density, f1_density, sample_size, replicates)
beta_simulated_c075 = beta_simulation(0.75, f0_density, f1_density, sample_size, replicates)

alpha_calculated_c075 = alpha_calculation(0.75, 0.0, 0.5, 1.0, sample_size)
beta_calculated_c075 = beta_calculation(0.75, 0.0, 0.5, 1.0, sample_size)

print("Simulated: c=0.75, alpha={0:.2f}, beta={1:.2f}".format(alpha_simulated_c075, beta_simulated_c075))
print("Calculated: c=0.75, alpha={0:.2f}, beta={1:.2f}".format(alpha_calculated_c075, beta_calculated_c075))

Als Trevor Hastie schließlich antwortete, dass "... eine Schwelle für x von ergibt " , bedeutet dies, dass in der folgenden Gleichung (siehe Abschnitt B aus dieser Frage): $k=0.4$

\bar{x} \geq k, wo k = \frac{c σ^{2}}{n (μ_{1} - - μ_{0})} + \frac{(μ_{1} + μ_{0})}{2}

$\bar{x} \ge k \text{, where } k = \frac{c\sigma^2}{n\left(\mu_1-\mu_0\right)} + \frac{\left(\mu_1+\mu_0\right)}{2}$

ergebend

t_{c} (x) = {\begin{cases} 1 wenn \bar{x} \geq k \\ 0 wenn \bar{x} < k . \end{cases}, wo k = \frac{c σ^{2}}{n (μ_{1} - - μ_{0})} + \frac{(μ_{1} + μ_{0})}{2}

In Python können wir also für einen Cutoff wie folgt erhalten: $k=0.4$ $c=0.75$

n = 10
m_0 = 0.0
m_1 = 0.5
variance = 1.0
c = 0.75

k = (c*variance)/(n*(m_1-m_0)) + (m_1+m_0)/2.0
threshold_for_x = k

print("threshold for x (when cutoff c=0.75) = {0:.1f}".format(threshold_for_x))

— Francisco Fonseca
quelle