Die Analyse kann etwas chaotisch sein, insbesondere wenn sie mit voller und elementarer Genauigkeit durchgeführt wird, aber die Idee ist einfach und leicht zu verstehen. Konzentrieren Sie sich auf kleine Regionen sehr nahe an und . Wenn sich und nähern , befindet sich fast die gesamte Wahrscheinlichkeit einer Beta- Verteilung in diesen Regionen. Indem wir die Größe der Regionen verkleinern, sehen wir, dass die Grenzverteilung, falls vorhanden, nur eine Bernoulli-Verteilung sein kann. Wir können eine begrenzende Verteilung nur erstellen, indem wir das Verhältnis einer Konstanten machen, genau wie in der Frage beschrieben.01αβ0(α,β)α:β
Das Schöne an dieser Analyse ist, dass bei Betrachtung der relativen Bereiche das Verhalten der Normalisierungskonstante, einer Beta-Funktion , nicht berücksichtigt werden muss . Dies ist eine erhebliche Vereinfachung. (Die Vermeidung der Beta-Funktion ähnelt im Geiste meiner Analyse von Beta-Verteilungsquantilen bei Bestimmen zwei Quantile einer Beta-Verteilung ihre Parameter? )B(α,β)
Ein weiteres Merkmal dieser Analyse ist die Approximation der unvollständigen Beta-Funktion durch einfache Integrale der Form für Konstanten . Dies reduziert alles auf die elementarsten Operationen von Kalkül und algebraischen Ungleichungen.∫tcdtc>−1
Das Beta-PDF ist proportional zuBetrachten Sie das kleine und untersuchen Sie die Beiträge zur Fläche unter innerhalb der drei Intervalle , und als und klein (bleibt aber positiv).
f(x)=xα−1(1−x)β−1.
ϵ>0f(0,ϵ](ϵ,1−ϵ)[1−ϵ,1)αβ
Letztendlich werden sowohl als auch kleiner als : wird daher sowohl bei als auch bei Pole haben , die so aussehen:αβ1f01
![Abbildung 1](https://i.stack.imgur.com/t29bt.png)
Der Graph von ist die obere blaue Linie. Im Vergleich dazu sind die Graphen von (rote Kurve, mit einem Pol nur bei ) und (Goldkurve, mit einem Pol nur bei ) .fxα−10(1−x)β−11
Was passiert mit den drei Bereichen unter im Limit relativ zueinander?f
Schreiben Sie als Notation für die Fläche unter dem Graphen von zwischen und . Ich frage nach den relativen Größen von , und .
F(x)=∫x0f(t)dt=∫x0tα−1(1−t)β−1dt
f0xF(ϵ)F(1−ϵ)−F(ϵ)F(1)−F(1−ϵ)
Lassen Sie uns diese Bereiche einzeln schätzen und immer und und . Unter diesen Annahmen0<α<10<β<1, 0<x<1,0<ϵ<1/2
xα−1>1;(1−x)β−1>1,
x→xα−1 (rot) ist eine abnehmende Funktion in und (Gold) ist eine zunehmende Funktion. x,x→(1−x)β−1
Links sieht es so aus, als würden sich die blauen und roten Kurven nähern. In der Tat ergeben die vorstehenden Ungleichungen für die GrenzenDie Integration zwischen und ist einfach und drückt zwischen zwei engen Grenzen,0<x<ϵ
xα−1<xα−1(1−x)β−1<xα−1(1−ϵ)β−1.
0ϵF(ϵ)ϵαα<F(ϵ)<(1−ϵ)β−1ϵαα.(1)
Die gleiche Analyse gilt für die rechte Seite und ergibt ein ähnliches Ergebnis.
Da konkav ist, erreicht es im mittleren Intervall seine Extremwerte an den Endpunkten. Folglich ist die Fläche kleiner als die des Trapezes, das von diesen Punkten überspannt wird:f[ϵ,1−ϵ]
F(1−ϵ)−F(ϵ)<12(f(ϵ)+f(1−ϵ))(1−ϵ−ϵ)=1−2ϵ2(ϵα−1(1−ϵ)β−1+(1−ϵ)α−1ϵβ−1)).(2)
Obwohl dies unordentlich zu werden droht, lassen Sie uns vorübergehend reparieren und überlegen, was mit dem Verhältnis als und Ansatz geschieht . In den Ausdrücken und nähern sich sowohl als auch . Somit sind die einzigen Begriffe, die im Limit von Bedeutung sind,ϵ(F(1−ϵ)−F(ϵ)):F(ϵ)αβ0(1)(2)(1−ϵ)α−1(1−ϵ)β−1(1−ϵ)0=1
F(1−ϵ)−F(ϵ)F(ϵ)≈(ϵα−1+ϵβ−1)/2ϵα/α=α2ϵ+α2ϵα−β≈αϵ(3)
weil . Folglich ist, da , der mittlere Bereich im Vergleich zum linken Bereich möglicherweise nicht von Belang.α−β≈0α→0
Das gleiche Argument zeigt, dass der mittlere Bereich schließlich in der Nähe von mal dem richtigen Bereich liegt, was ebenfalls unwichtig wird. Dies zeigt, dassβ/ϵ
(∗) Egal wie mag, wenn wir sowohl als auch als ausreichend klein betrachten, wird im Wesentlichen der gesamte Bereich unter innerhalb des linken Intervalls und das richtige Intervall .0<ϵ<1/2 αβf(0,ϵ)(1−ϵ,1)
Der Rest ist einfach: Der Mittelwert liegt sehr nahe am Bereich nahe dem rechten Pol (Beweis: Unterschätzen Sie ihn, indem Sie durch in den Integralen über das linke und mittlere Intervall und durch im rechten Intervall, dann überschätzen Sie es, indem Sie durch links, in der Mitte und at ersetzen beide Ausdrücke nähern sich genau an .) Aber nach die relativen Flächen ungefährxf(x)0f(x)(1−ϵ)f(x)xf(x)ϵf(x)(1−ϵ)f(x)f(x)F(1)−F(1−ϵ)(3),
F(1)−F(1−ϵ)F(ϵ)≈ϵ/βϵ/α=αβ.
Indem der Mittelwert konstant gehalten wird, bleibt dieses Verhältnis konstant, sodass wir noch eine weitere Beobachtung hinzufügen können :(∗)
(∗∗) Wenn wir und so lassen, dass sich einer Grenzkonstante nähert , dann schließlich das Verhältnis der Fläche rechts zur Fläche am left wird auch willkürlich in der Nähe von sein.α→0β→0α/βλλ
Nun betrachten schrumpft auf Null. Das Ergebnis ist, dass die Grenzverteilung existiert und ihre gesamte Wahrscheinlichkeit um die Werte und : Dies ist die Klasse der Bernoulli-Verteilungen. Stifte nach unten das man: Da die Bernoulli Verteilung, dessen Mittelwert ist Abtretungs Wahrscheinlichkeit auf und die Wahrscheinlichkeit bis , das Verhältnis muß das Begrenzungsverhältnis seinϵ01(∗∗)(p)p,p11−p0p/(1−p)λ.
In der Terminologie der Frage ist
λ=α/(1−μμα)=μ1−μ=p1−p,
wie behauptet.