Bernoulli zu beweisen ist die Grenze der Beta


7

Durch Inspektion wird mir klar, dass sich die Beta-Verteilung einem Bernoulli ( nähert , wenn wir (wodurch der Mittelwert festgelegt wird) und ) Verteilung.β=1μμαα0μ

Zum Beispiel:

par(mfrow = c(1, 2),
    oma = c(0, 0, 1.5, 0))
xx = seq(0, 1, length.out = 1000)
mus = c(.2, .7)
for (ii in 1:2) {
  mu = mus[ii]
  matplot(xx, sapply(10^(-1:-5), function(al) 
    pbeta(xx, al, (1-mu)/mu * al)),
    type = 'l', lty = ii,
    main = paste('Mean:', mu),
    ylab = 'Cumulative Probability', xlab = 'x')
}
title('Beta Approaches Bernoulli', outer = TRUE)

Geben Sie hier die Bildbeschreibung ein

Das heißt, wenn ist , erfüllt seine CDFXB(α,1μμα)FX(x;α,μ)

limα0FX(x;α,μ)=1μ=FY(x)x(0,1)

Wobei Bernoulli ( ) und die Konvergenz ungleichmäßig ist. Ich habe versucht, einen formelleren Beweis dafür zu erbringen, konnte aber selbst in einfachen Fällen (wie ) keine Fortschritte . Die Wikipedia-Seite zur Beta verweist mehrmals ohne Beweis auf den Fall . Vielleicht fehlt mir etwas Leichtes am Integral oder eine Tatsache über die Beta / unvollständige Beta-Funktion. Jede Hilfe wäre dankbar!Yμμ=12μ=12


1
Meine Antwort unter stats.stackexchange.com/a/237849/919 impliziert dies, da sie zeigt, dass sich die Grenzwahrscheinlichkeiten auf und . Eine Illustration finden Sie im zweiten Grafikpaar. 01
whuber

Antworten:


7

Die Analyse kann etwas chaotisch sein, insbesondere wenn sie mit voller und elementarer Genauigkeit durchgeführt wird, aber die Idee ist einfach und leicht zu verstehen. Konzentrieren Sie sich auf kleine Regionen sehr nahe an und . Wenn sich und nähern , befindet sich fast die gesamte Wahrscheinlichkeit einer Beta- Verteilung in diesen Regionen. Indem wir die Größe der Regionen verkleinern, sehen wir, dass die Grenzverteilung, falls vorhanden, nur eine Bernoulli-Verteilung sein kann. Wir können eine begrenzende Verteilung nur erstellen, indem wir das Verhältnis einer Konstanten machen, genau wie in der Frage beschrieben.01αβ0(α,β)α:β

Das Schöne an dieser Analyse ist, dass bei Betrachtung der relativen Bereiche das Verhalten der Normalisierungskonstante, einer Beta-Funktion , nicht berücksichtigt werden muss . Dies ist eine erhebliche Vereinfachung. (Die Vermeidung der Beta-Funktion ähnelt im Geiste meiner Analyse von Beta-Verteilungsquantilen bei Bestimmen zwei Quantile einer Beta-Verteilung ihre Parameter? )B(α,β)

Ein weiteres Merkmal dieser Analyse ist die Approximation der unvollständigen Beta-Funktion durch einfache Integrale der Form für Konstanten . Dies reduziert alles auf die elementarsten Operationen von Kalkül und algebraischen Ungleichungen.tcdtc>1


Das Beta-PDF ist proportional zuBetrachten Sie das kleine und untersuchen Sie die Beiträge zur Fläche unter innerhalb der drei Intervalle , und als und klein (bleibt aber positiv).

f(x)=xα1(1x)β1.
ϵ>0f(0,ϵ](ϵ,1ϵ)[1ϵ,1)αβ

Letztendlich werden sowohl als auch kleiner als : wird daher sowohl bei als auch bei Pole haben , die so aussehen:αβ1f01

Abbildung 1

Der Graph von ist die obere blaue Linie. Im Vergleich dazu sind die Graphen von (rote Kurve, mit einem Pol nur bei ) und (Goldkurve, mit einem Pol nur bei ) .fxα10(1x)β11

Was passiert mit den drei Bereichen unter im Limit relativ zueinander?f

Schreiben Sie als Notation für die Fläche unter dem Graphen von zwischen und . Ich frage nach den relativen Größen von , und .

F(x)=0xf(t)dt=0xtα1(1t)β1dt
f0xF(ϵ)F(1ϵ)F(ϵ)F(1)F(1ϵ)

Lassen Sie uns diese Bereiche einzeln schätzen und immer und und . Unter diesen Annahmen0<α<10<β<1, 0<x<1,0<ϵ<1/2

xα1>1;(1x)β1>1,

xxα1 (rot) ist eine abnehmende Funktion in und (Gold) ist eine zunehmende Funktion. x,x(1x)β1

  1. Links sieht es so aus, als würden sich die blauen und roten Kurven nähern. In der Tat ergeben die vorstehenden Ungleichungen für die GrenzenDie Integration zwischen und ist einfach und drückt zwischen zwei engen Grenzen,0<x<ϵ

    xα1<xα1(1x)β1<xα1(1ϵ)β1.
    0ϵF(ϵ)
    (1)ϵαα<F(ϵ)<(1ϵ)β1ϵαα.
  2. Die gleiche Analyse gilt für die rechte Seite und ergibt ein ähnliches Ergebnis.

  3. Da konkav ist, erreicht es im mittleren Intervall seine Extremwerte an den Endpunkten. Folglich ist die Fläche kleiner als die des Trapezes, das von diesen Punkten überspannt wird:f[ϵ,1ϵ]

    (2)F(1ϵ)F(ϵ)<12(f(ϵ)+f(1ϵ))(1ϵϵ)=12ϵ2(ϵα1(1ϵ)β1+(1ϵ)α1ϵβ1)).

Obwohl dies unordentlich zu werden droht, lassen Sie uns vorübergehend reparieren und überlegen, was mit dem Verhältnis als und Ansatz geschieht . In den Ausdrücken und nähern sich sowohl als auch . Somit sind die einzigen Begriffe, die im Limit von Bedeutung sind,ϵ(F(1ϵ)F(ϵ)):F(ϵ)αβ0(1)(2)(1ϵ)α1(1ϵ)β1(1ϵ)0=1

(3)F(1ϵ)F(ϵ)F(ϵ)(ϵα1+ϵβ1)/2ϵα/α=α2ϵ+α2ϵαβαϵ

weil . Folglich ist, da , der mittlere Bereich im Vergleich zum linken Bereich möglicherweise nicht von Belang.αβ0α0

Das gleiche Argument zeigt, dass der mittlere Bereich schließlich in der Nähe von mal dem richtigen Bereich liegt, was ebenfalls unwichtig wird. Dies zeigt, dassβ/ϵ

() Egal wie mag, wenn wir sowohl als auch als ausreichend klein betrachten, wird im Wesentlichen der gesamte Bereich unter innerhalb des linken Intervalls und das richtige Intervall .0<ϵ<1/2 αβf(0,ϵ)(1ϵ,1)

Der Rest ist einfach: Der Mittelwert liegt sehr nahe am Bereich nahe dem rechten Pol (Beweis: Unterschätzen Sie ihn, indem Sie durch in den Integralen über das linke und mittlere Intervall und durch im rechten Intervall, dann überschätzen Sie es, indem Sie durch links, in der Mitte und at ersetzen beide Ausdrücke nähern sich genau an .) Aber nach die relativen Flächen ungefährxf(x)0f(x)(1ϵ)f(x)xf(x)ϵf(x)(1ϵ)f(x)f(x)F(1)F(1ϵ)(3),

F(1)F(1ϵ)F(ϵ)ϵ/βϵ/α=αβ.

Indem der Mittelwert konstant gehalten wird, bleibt dieses Verhältnis konstant, sodass wir noch eine weitere Beobachtung hinzufügen können :()

() Wenn wir und so lassen, dass sich einer Grenzkonstante nähert , dann schließlich das Verhältnis der Fläche rechts zur Fläche am left wird auch willkürlich in der Nähe von sein.α0β0α/βλλ

Nun betrachten schrumpft auf Null. Das Ergebnis ist, dass die Grenzverteilung existiert und ihre gesamte Wahrscheinlichkeit um die Werte und : Dies ist die Klasse der Bernoulli-Verteilungen. Stifte nach unten das man: Da die Bernoulli Verteilung, dessen Mittelwert ist Abtretungs Wahrscheinlichkeit auf und die Wahrscheinlichkeit bis , das Verhältnis muß das Begrenzungsverhältnis seinϵ01()(p)p,p11p0p/(1p)λ.

In der Terminologie der Frage ist

λ=α/(1μμα)=μ1μ=p1p,

wie behauptet.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.