Was ist eine wichtige Stichprobe?

Ich versuche, Bestärkungslernen zu lernen und dieses Thema ist für mich wirklich verwirrend. Ich habe eine Einführung in die Statistik genommen, konnte dieses Thema aber nicht intuitiv verstehen.

— Tienanh Nguyen
quelle

Antworten:

Die Stichprobe zur Ermittlung der Bedeutung ist eine Form der Stichprobe aus einer Verteilung, die sich von der Verteilung des Interesses unterscheidet , um leichter bessere Schätzungen eines Parameters aus der Verteilung des Interesses zu erhalten. In der Regel liefert dies Schätzungen des Parameters mit einer geringeren Varianz, als wenn die Stichprobe direkt aus der ursprünglichen Verteilung mit derselben Stichprobengröße entnommen würde.

Es wird in verschiedenen Zusammenhängen angewendet. Im Allgemeinen ermöglicht das Abtasten aus der unterschiedlichen Verteilung, dass mehr Proben in einem Teil der interessierenden Verteilung entnommen werden , der von der Anwendung vorgegeben wird (wichtiger Bereich).

Ein Beispiel könnte sein, dass Sie eine Stichprobe haben möchten, die mehr Stichproben aus den Endpunkten der Verteilung enthält, als reine Zufallsstichproben aus der Verteilung von Interesse liefern würden.

Der Wikipedia-Artikel , den ich zu diesem Thema gesehen habe, ist zu abstrakt. Es ist besser, sich verschiedene spezifische Beispiele anzuschauen. Es enthält jedoch Links zu interessanten Anwendungen wie Bayesian Networks.

Ein Beispiel für eine wichtige Stichprobe in den 1940er und 1950er Jahren ist eine Varianzreduktionstechnik (eine Form der Monte-Carlo-Methode). Siehe zum Beispiel das Buch Monte Carlo Methods von Hammersley und Handscomb, das 1964 als Methuen Monograph / Chapman and Hall veröffentlicht und 1966 und später von anderen Verlagen nachgedruckt wurde. Abschnitt 5.4 des Buches behandelt die Stichprobenerhebung.

— Michael R. Chernick
quelle

Um dies hinzuzufügen: In RL wenden Sie im Allgemeinen eine Stichprobenerhebung zur Wichtigkeit der Richtlinie an: z. B. Stichprobenerfassung von Aktionen aus einer Explorationsrichtlinie anstelle der tatsächlichen Richtlinie, für die Sie eine Stichprobe

— erstellen

Diese Antwort fängt gut damit an, zu erklären, welche Bedeutung die Stichprobenentnahme hat, aber ich war enttäuscht, dass sie niemals die Frage beantwortet, welche Bedeutung die Stichprobenentnahme hat : Wie funktioniert sie?

— Whuber

@whuber Mein Ziel hier war es, einem verwirrten OP das Konzept zu erklären und ihn auf Literatur hinzuweisen. Es ist ein großes Thema und wird in scheinbar unterschiedlichen Anwendungen verwendet. Andere sind möglicherweise in der Lage, die Details in einfachen Worten besser zu erklären als ich. Ich weiß, dass Sie, wenn Sie sich dazu entschließen, eine Frage zu beantworten, alles daran setzen, schöne Grafiken zu erstellen und technische Details im Klartext durchzugehen. Diese Beiträge befriedigen die Community fast immer mit ihrer Klarheit und Vollständigkeit, und ich wage zu sagen, dass sie das OP zumindest teilweise befriedigen. Vielleicht würden ein paar Sätze mit Gleichungen ausreichen, wie Sie vorschlagen.

— Michael R. Chernick

Vielleicht ist es besser für die Community, eine Antwort auf die Frage zu finden, als nur auf andere Quellen zu verweisen oder sogar Links bereitzustellen. Ich war einfach der Meinung, dass das, was ich getan habe, angemessen war und das OP, das zugibt, ein Statistik-Neuling zu sein, sich zuerst selbst anstrengen sollte.

— Michael R. Chernick

Du hast einen Punkt. Ich frage mich jedoch, ob es möglich sein könnte, in nur einem oder zwei weiteren Sätzen - keine Mathematik, keine Grafiken, kaum zusätzliche Arbeit - eine Antwort auf die gestellte Frage zu geben. In diesem Fall müsste in der Beschreibung hervorgehoben werden, dass man die Erwartung schätzt (nicht irgendeinen "Parameter"), und dann vielleicht darauf hinweisen, dass man, da die Erwartung ein Produkt aus Werten und Wahrscheinlichkeiten summiert, dasselbe Ergebnis durch Ändern der Wahrscheinlichkeiten erhält ( zu denen einer Distribution, aus der man leicht Samples erstellen kann) und die Werte anpassen, um dies zu kompensieren.

— Whuber

Die Wichtigkeitsabtastung ist eine Simulation oder Monte-Carlo-Methode zur Approximation von Integralen. Der Begriff "Stichprobe" ist insofern etwas verwirrend, als er keine Stichproben aus einer bestimmten Verteilung liefern soll.

Die Intuition hinter der Wichtigkeitsabtastung ist, dass ein genau definiertes Integral wie kann als Erwartung für einen weiten Bereich von Wahrscheinlichkeitsverteilungen ausgedrückt werden:

I = \int_{X} h (x) d x

$\mathfrak{I}=\int_\mathfrak{X} h(x)\,\text{d}x$

wobei

die Dichte einer Wahrscheinlichkeitsverteilung bezeichnet und

durch

und

. (Beachten Sie, dass sich normalerweise von .)In der Tat ist die Wahl

I = E_{f} [H (X)] = \int_{X} H (x) f (x) d x

$\mathfrak{I}=\mathbb{E}_f[H(X)]=\int_\mathfrak{X} H(x)f(x)\,\text{d}x$

f

$f$

H

$H$

h

$h$

f

$f$ $H(\cdot)$ $h(\cdot)$

führt zu den Gleichungen

und

unter gewissen Einschränkungen für die Unterstützung von

, was

wenn

H (x) = \frac{h (x)}{f (x)}

$H(x)=\dfrac{h(x)}{f(x)}$

H (x) f (x) = h (x)

$H(x)f(x)=h(x)$

I = E_{f} [H (X)]

$\mathfrak{I}=\mathbb{E}_f[H(X)]$

-

$-$

f

$f$

f (x) > 0

$f(x)>0$

h (x) \neq 0

$h(x)\ne 0$

-

$-$ . Wie W. Huber in seinem Kommentar hervorhob, gibt es daher keine Einheitlichkeit in der Darstellung eines Integrals als Erwartung, sondern im Gegenteil eine unendliche Reihe solcher Darstellungen, von denen einige besser sind als andere, sobald sie ein Vergleichskriterium darstellen sie wird adoptiert. Zum Beispiel erwähnt Michael Chernick die Wahl von

, um die Varianz des Schätzers zu verringern.

f

$f$

Wenn diese elementare Eigenschaft erst einmal verstanden ist, besteht die Umsetzung der Idee darin, sich auf das Gesetz der großen Zahlen wie bei anderen Monte-Carlo-Methoden zu stützen, dh [über einen Pseudozufallsgenerator] eine iid-Stichprobe zu simulieren von verteilten und die Approximation zu verwenden $(x_1,\ldots,x_n)$ $f$ welches

\hat{I} = \frac{1}{n} \sum_{i = 1}^{n} H (x_{i})

$\hat{\mathfrak{I}}=\frac{1}{n} \sum_{i=1}^n H(x_i)$

ist ein unvoreingenommener Schätzer von $\mathfrak{I}$
konvergiert fast sicher zu $\mathfrak{I}$

Je nach Wahl der Verteilung , die oben Schätzer kann oder auch nicht eine endliche Varianz haben. Es gibt jedoch immer Optionen für , die eine endliche Varianz und sogar eine willkürlich kleine Varianz zulassen (obwohl diese Optionen in der Praxis möglicherweise nicht verfügbar sind). Und gibt es auch Entscheidungen von , die die Importance Sampling - Schätzer machen eine sehr schlechte Annäherung der . Dies schließt alle Möglichkeiten ein, bei denen die Varianz unendlich wird, obwohl ein kürzlich veröffentlichter Aufsatz von Chatterjee und Diaconis untersucht, wie man Wichtigkeitssampler mit der Varianz unendlich vergleicht. Das Bild unten stammt von $f$ $\hat{\mathfrak{I}}$ $f$ $f$ $\hat{\mathfrak{I}}$ ${\mathfrak{I}}$ mein Blog Diskussion über das Papier und zeigt die schlechte Konvergenz unendlichen Varianz - Schätzer.

Wichtigkeitsstichprobe mit Wichtigkeitsverteilung und Exp (1) -Verteilung Zielverteilung und Exp (1/10) -Verteilung und interessierender Funktion . Der wahre Wert des Integrals ist . $h(x)=x$ $10$

[Das Folgende ist aus unserem Buch Monte Carlo Statistical Methods wiedergegeben .]

$f$

\int_{X} h (x) f (x) d x

$\int_\mathfrak{X} h(x) f(x)\,\text{d}x$

$p$ ${\mathcal{C}}(0,1)$ $2$ Wenn wird durch den empirischen Mittelwert ausgewertet

p = \int_{2}^{+ \infty} \frac{1}{π (1 + x^{2})} d x .

$p = \int_2^{+\infty} \; {1\over \pi(1 + x^2)} \; \text{d}x \;.$

p

$p$

einer iid-Stichprobe

{\hat{p}}_{1} = \frac{1}{m} \sum_{j = 1}^{m} I_{X_{j} > 2}

${\hat{p}}_1 = {1\over m} \; \sum_{j=1}^m \; \mathbb{I}_{X_{j} > 2}$

X_{1}, \dots, X_{m}

$X_1,\ldots,X_m$

\sim

$\sim$

C (0, 1)

$\; \mathcal{C}(0,1)$

p (1 - p) / m

$p(1-p)/m$

0.127 / m

$0.127/m$

p = 0.15

$p=0.15$

${\mathcal{C}}(0,1)$

{\hat{p}}_{2} = \frac{1}{2 m} \sum_{j = 1}^{m} I_{| X_{j} | > 2}

${\hat{p}}_2 = {1\over 2m} \; \sum_{j=1}^m \; \mathbb{I}_{|X_{j}| > 2}$

p (1 - 2 p) / 2 m

$p(1-2p)/2m$

0.052 / m

$0.052/m$

$[2,+\infty)$ $p$ $p$

p = \frac{1}{2} - \int_{0}^{2} \frac{1}{π (1 + x^{2})} d x,

$p = {1\over 2} - \int_0^2 \; {1\over \pi(1 + x^2)} \; \text{d}x \;,$

h (X) = 2 / π (1 + X^{2})

$h(X) = 2/\pi(1 + X^2)$

X \sim U_{[0, 2]}

$X \sim {\mathcal{U}}_{[0, 2]}$

p

$p$

{\hat{p}}_{3} = \frac{1}{2} - \frac{1}{m} \sum_{j = 1}^{m} h (U_{j})

${\hat{p}}_3 = {1\over 2} - {1\over m} \; \sum_{j=1}^m \; h(U_j)$

U_{j} \sim U_{[0, 2]}

$U_j \sim {\mathcal{U}}_{[0,2]}$

{\hat{p}}_{3}

${\hat{p}}_3$

(E [h^{2}] - E [h]^{2}) / m

$(\mathbb{E}[h^2] - \mathbb{E}[h]^2)/m$

0.0285 / m

$0.0285/m$

p

$p$

p = \int_{0}^{1 / 2} \frac{y^{- 2}}{π (1 + y^{- 2})} d y,

$p = \int_0^{1/2} \; {y^{-2}\over \pi(1 + y^{-2})} \; \text{d}y \;,$

\frac{1}{4} h (Y) = 1 / 2 π (1 + Y^{2})

${1\over 4} \; h(Y) = 1/2\pi(1 + Y^2)$

[0, 1 / 2]

$[0,1/2]$

p

$p$

{\hat{p}}_{4} = \frac{1}{4 m} \sum_{j = 1}^{m} h (Y_{j})

${\hat{p}}_4 = {1\over 4 m} \; \sum_{j=1}^m \; h(Y_j)$

Y_{j} \sim U_{[0, 1 / 2]}

$Y_j \sim {\mathcal{U}}_{[0,1/2]}$

{\hat{p}}_{4}

${\hat{p}}_{4}$

0.95 10^{- 4} / m

$0.95 \; 10^{-4}/m$

${\hat{p}}_1$ ${\hat p}_4$ $10^{-3}$ $\sqrt{1000} \approx 32$ $\hat p_1$ $\blacktriangleright$

— Xi'an
quelle

Vielen Dank an @Xi 'an, dass Sie sich die Mühe gemacht haben, wichtige Stichproben auf eine Art und Weise zu veranschaulichen, die jeder zu schätzen weiß, und ich denke, Bill Hubers Bitte wird mehr als gerecht. +1

— Michael R. Chernick

Ich möchte darauf hinweisen, dass dieser Beitrag zunächst auf Eis gelegt wurde und dank der Beiträge mehrerer Personen. Wir haben uns einen informativen Thread ausgedacht.

— Michael R. Chernick

Christian, ich möchte mich ganz herzlich bei dir bedanken und ein Gefühl des Privilegs ausdrücken, dass du so hervorragendes Material aktiv mit uns teilst.

— whuber

Ich möchte mich nur bei Xi'an bedanken, der so freundlich war, einige Änderungen vorzunehmen, um meine Antwort zu verbessern, obwohl er eine seiner eigenen gab.

— Michael R. Chernick

Dies muss einer der besten Beiträge auf stats.stackexchange sein. Danke für das Teilen!

— Dohmatob