Bernoulli zu beweisen ist die Grenze der Beta

Durch Inspektion wird mir klar, dass sich die Beta-Verteilung einem Bernoulli ( nähert , wenn wir (wodurch der Mittelwert festgelegt wird) und ) Verteilung. $\beta = \frac{1-\mu}{\mu} \alpha$ $\alpha \rightarrow 0$ $\mu$

Zum Beispiel:

par(mfrow = c(1, 2),
    oma = c(0, 0, 1.5, 0))
xx = seq(0, 1, length.out = 1000)
mus = c(.2, .7)
for (ii in 1:2) {
  mu = mus[ii]
  matplot(xx, sapply(10^(-1:-5), function(al) 
    pbeta(xx, al, (1-mu)/mu * al)),
    type = 'l', lty = ii,
    main = paste('Mean:', mu),
    ylab = 'Cumulative Probability', xlab = 'x')
}
title('Beta Approaches Bernoulli', outer = TRUE)

Das heißt, wenn ist , erfüllt seine CDF $X \sim B(\alpha, \frac{1-\mu}{\mu} \alpha)$ $F_X(x; \alpha, \mu)$

lim_{α \to 0} F_{X} (x; α, μ) = 1 - μ = F_{Y} (x) \forall x \in (0, 1)

$\lim_{\alpha \rightarrow 0} F_X(x; \alpha, \mu) = 1 - \mu = F_Y(x) \quad \forall x \in (0, 1)$

Wobei Bernoulli ( ) und die Konvergenz ungleichmäßig ist. Ich habe versucht, einen formelleren Beweis dafür zu erbringen, konnte aber selbst in einfachen Fällen (wie ) keine Fortschritte . Die Wikipedia-Seite zur Beta verweist mehrmals ohne Beweis auf den Fall . Vielleicht fehlt mir etwas Leichtes am Integral oder eine Tatsache über die Beta / unvollständige Beta-Funktion. Jede Hilfe wäre dankbar! $Y \sim$ $\mu$ $\mu = \frac12$ $\mu = \frac12$

convergence beta-distribution bernoulli-distribution

— MichaelChirico
quelle

Meine Antwort unter stats.stackexchange.com/a/237849/919 impliziert dies, da sie zeigt, dass sich die Grenzwahrscheinlichkeiten auf und . Eine Illustration finden Sie im zweiten Grafikpaar.

0

$0$

1

$1$

— whuber

Die Analyse kann etwas chaotisch sein, insbesondere wenn sie mit voller und elementarer Genauigkeit durchgeführt wird, aber die Idee ist einfach und leicht zu verstehen. Konzentrieren Sie sich auf kleine Regionen sehr nahe an und . Wenn sich und nähern , befindet sich fast die gesamte Wahrscheinlichkeit einer Beta- Verteilung in diesen Regionen. Indem wir die Größe der Regionen verkleinern, sehen wir, dass die Grenzverteilung, falls vorhanden, nur eine Bernoulli-Verteilung sein kann. Wir können eine begrenzende Verteilung nur erstellen, indem wir das Verhältnis einer Konstanten machen, genau wie in der Frage beschrieben. $0$ $1$ $\alpha$ $\beta$ $0$ $(\alpha,\beta)$ $\alpha:\beta$

Das Schöne an dieser Analyse ist, dass bei Betrachtung der relativen Bereiche das Verhalten der Normalisierungskonstante, einer Beta-Funktion , nicht berücksichtigt werden muss . Dies ist eine erhebliche Vereinfachung. (Die Vermeidung der Beta-Funktion ähnelt im Geiste meiner Analyse von Beta-Verteilungsquantilen bei Bestimmen zwei Quantile einer Beta-Verteilung ihre Parameter? ) $B(\alpha,\beta)$

Ein weiteres Merkmal dieser Analyse ist die Approximation der unvollständigen Beta-Funktion durch einfache Integrale der Form für Konstanten . Dies reduziert alles auf die elementarsten Operationen von Kalkül und algebraischen Ungleichungen. $\int t^c\mathrm{d}t$ $c\gt -1$

Das Beta-PDF ist proportional zuBetrachten Sie das kleine und untersuchen Sie die Beiträge zur Fläche unter innerhalb der drei Intervalle , und als und klein (bleibt aber positiv).

f (x) = x^{α - 1} (1 - x)^{β - 1} .

$f(x)=x^{\alpha-1}(1-x)^{\beta-1}.$

ϵ > 0

$\epsilon\gt 0$

f

$f$

(0, ϵ]

$(0,\epsilon]$

(ϵ, 1 - ϵ)

$(\epsilon, 1-\epsilon)$

[1 - ϵ, 1)

$[1-\epsilon, 1)$

α

$\alpha$

β

$\beta$

Letztendlich werden sowohl als auch kleiner als : wird daher sowohl bei als auch bei Pole haben , die so aussehen: $\alpha$ $\beta$ $1$ $f$ $0$ $1$

Der Graph von ist die obere blaue Linie. Im Vergleich dazu sind die Graphen von (rote Kurve, mit einem Pol nur bei ) und (Goldkurve, mit einem Pol nur bei ) . $f$ $x^{\alpha-1}$ $0$ $(1-x)^{\beta-1}$ $1$

Was passiert mit den drei Bereichen unter im Limit relativ zueinander? $f$

Schreiben Sie als Notation für die Fläche unter dem Graphen von zwischen und . Ich frage nach den relativen Größen von , und .

F (x) = \int_{0}^{x} f (t) d t = \int_{0}^{x} t^{α - 1} (1 - t)^{β - 1} d t

$F(x) = \int_0^x f(t)\mathrm{d}t = \int_0^x t^{\alpha-1}(1-t)^{\beta-1}\mathrm{d}t$

f

$f$

0

$0$

x

$x$

F (ϵ)

$F(\epsilon)$

F (1 - ϵ) - F (ϵ)

$F(1-\epsilon)-F(\epsilon)$

F (1) - F (1 - ϵ)

$F(1)-F(1-\epsilon)$

Lassen Sie uns diese Bereiche einzeln schätzen und immer und und . Unter diesen Annahmen $0 \lt \alpha \lt 1$ $0\lt \beta \lt 1,$ $0\lt x \lt 1,$ $0\lt \epsilon \lt 1/2$

x^{α - 1} > 1; (1 - x)^{β - 1} > 1,

$x^{\alpha-1} \gt 1;\quad(1-x)^{\beta-1}\gt 1,$

$x\to x^{\alpha-1}$ (rot) ist eine abnehmende Funktion in und (Gold) ist eine zunehmende Funktion. $x,$ $x\to (1-x)^{\beta-1}$

Links sieht es so aus, als würden sich die blauen und roten Kurven nähern. In der Tat ergeben die vorstehenden Ungleichungen für die GrenzenDie Integration zwischen und ist einfach und drückt zwischen zwei engen Grenzen, $0\lt x \lt \epsilon$
$x^{α - 1} < x^{α - 1} (1 - x)^{β - 1} < x^{α - 1} (1 - ϵ)^{β - 1} .$ $x^{\alpha-1} \lt x^{\alpha-1}(1-x)^{\beta-1} \lt x^{\alpha-1}(1-\epsilon)^{\beta-1}.$ $0$ $\epsilon$ $F(\epsilon)$ $\begin{matrix} (1) & \frac{ϵ^{α}}{α} < F (ϵ) < (1 - ϵ)^{β - 1} \frac{ϵ^{α}}{α} . \end{matrix}$ $\frac{\epsilon^\alpha}{\alpha} \lt F(\epsilon) \lt (1-\epsilon)^{\beta-1} \frac{\epsilon^\alpha}{\alpha}.\tag{1}$
Die gleiche Analyse gilt für die rechte Seite und ergibt ein ähnliches Ergebnis.
Da konkav ist, erreicht es im mittleren Intervall seine Extremwerte an den Endpunkten. Folglich ist die Fläche kleiner als die des Trapezes, das von diesen Punkten überspannt wird: $f$ $[\epsilon, 1-\epsilon]$
$\begin{matrix} (2) & \begin{aligned} F (1 - ϵ) - F (ϵ) & < \frac{1}{2} (f (ϵ) + f (1 - ϵ)) (1 - ϵ - ϵ) \\ = \frac{1 - 2 ϵ}{2} (ϵ^{α - 1} (1 - ϵ)^{β - 1} + (1 - ϵ)^{α - 1} ϵ^{β - 1})) . \end{aligned} \end{matrix}$ $\eqalign{ F(1-\epsilon) - F(\epsilon) &\lt \frac{1}{2}\left(f(\epsilon) + f(1-\epsilon)\right)(1-\epsilon - \epsilon)\\ &= \frac{1-2\epsilon}{2}\left(\epsilon^{\alpha-1}(1-\epsilon)^{\beta-1} + (1-\epsilon)^{\alpha-1}\epsilon^{\beta-1}\right)).\tag{2} }$

Obwohl dies unordentlich zu werden droht, lassen Sie uns vorübergehend reparieren und überlegen, was mit dem Verhältnis als und Ansatz geschieht . In den Ausdrücken und nähern sich sowohl als auch . Somit sind die einzigen Begriffe, die im Limit von Bedeutung sind, $\epsilon$ $(F(1-\epsilon)-F(\epsilon)):F(\epsilon)$ $\alpha$ $\beta$ $0$ $(1)$ $(2)$ $(1-\epsilon)^{\alpha-1}$ $(1-\epsilon)^{\beta-1}$ $(1-\epsilon)^0=1$

\begin{matrix} (3) & \frac{F (1 - ϵ) - F (ϵ)}{F (ϵ)} \approx \frac{(ϵ^{α - 1} + ϵ^{β - 1}) / 2}{ϵ^{α} / α} = \frac{α}{2 ϵ} + \frac{α}{2 ϵ^{α - β}} \approx \frac{α}{ϵ} \end{matrix}

$\frac{F(1-\epsilon)-F(\epsilon)}{F(\epsilon)} \approx \frac{(\epsilon^{\alpha-1} + \epsilon^{\beta-1})/2}{\epsilon^\alpha / \alpha} = \frac{\alpha}{2\epsilon} + \frac{\alpha}{2\epsilon^{\alpha-\beta}} \approx \frac{\alpha}{\epsilon}\tag{3}$

weil . Folglich ist, da , der mittlere Bereich im Vergleich zum linken Bereich möglicherweise nicht von Belang. $\alpha-\beta \approx 0$ $\alpha\to 0$

Das gleiche Argument zeigt, dass der mittlere Bereich schließlich in der Nähe von mal dem richtigen Bereich liegt, was ebenfalls unwichtig wird. Dies zeigt, dass $\beta/\epsilon$

$(*)$ Egal wie mag, wenn wir sowohl als auch als ausreichend klein betrachten, wird im Wesentlichen der gesamte Bereich unter innerhalb des linken Intervalls und das richtige Intervall . $0\lt \epsilon\lt 1/2$ $\alpha$ $\beta$ $f$ $(0,\epsilon)$ $(1-\epsilon, 1)$

Der Rest ist einfach: Der Mittelwert liegt sehr nahe am Bereich nahe dem rechten Pol (Beweis: Unterschätzen Sie ihn, indem Sie durch in den Integralen über das linke und mittlere Intervall und durch im rechten Intervall, dann überschätzen Sie es, indem Sie durch links, in der Mitte und at ersetzen beide Ausdrücke nähern sich genau an .) Aber nach die relativen Flächen ungefähr $xf(x)$ $0f(x)$ $(1-\epsilon)f(x)$ $xf(x)$ $\epsilon f(x)$ $(1-\epsilon)f(x)$ $f(x)$ $F(1)-F(1-\epsilon)$ $(3),$

\frac{F (1) - F (1 - ϵ)}{F (ϵ)} \approx \frac{ϵ / β}{ϵ / α} = \frac{α}{β} .

$\frac{F(1)-F(1-\epsilon)}{F(\epsilon)} \approx \frac{\epsilon/\beta}{\epsilon/\alpha} = \frac{\alpha}{\beta}.$

Indem der Mittelwert konstant gehalten wird, bleibt dieses Verhältnis konstant, sodass wir noch eine weitere Beobachtung hinzufügen können : $(*)$

$(**)$ Wenn wir und so lassen, dass sich einer Grenzkonstante nähert , dann schließlich das Verhältnis der Fläche rechts zur Fläche am left wird auch willkürlich in der Nähe von sein. $\alpha\to 0$ $\beta\to 0$ $\alpha/\beta$ $\lambda$ $\lambda$

Nun betrachten schrumpft auf Null. Das Ergebnis ist, dass die Grenzverteilung existiert und ihre gesamte Wahrscheinlichkeit um die Werte und : Dies ist die Klasse der Bernoulli-Verteilungen. Stifte nach unten das man: Da die Bernoulli Verteilung, dessen Mittelwert ist Abtretungs Wahrscheinlichkeit auf und die Wahrscheinlichkeit bis , das Verhältnis muß das Begrenzungsverhältnis sein $\epsilon$ $0$ $1$ $(**)$ $(p)$ $p,$ $p$ $1$ $1-p$ $0$ $p/(1-p)$ $\lambda.$

In der Terminologie der Frage ist

λ = α / (\frac{1 - μ}{μ} α) = \frac{μ}{1 - μ} = \frac{p}{1 - p},

$\lambda = \alpha / \left(\frac{1-\mu}{\mu}\alpha\right) = \frac{\mu}{1-\mu} = \frac{p}{1-p},$

wie behauptet.

— whuber
quelle