Bestimmen zwei Quantile einer Beta-Verteilung ihre Parameter?

Wenn ich zwei Quantile $(q_1,q_2)$ und ihre entsprechenden Positionen $(l_1,l_2)$ (jeweils) im offenen Intervall gebe $(0,1)$ , kann ich immer Parameter einer Beta-Verteilung finden, bei der diese Quantile vorliegen die angegebenen Standorte?

quantiles curve-fitting beta-distribution

— Bota
quelle

Nein, grundlegendes Gegenbeispiel (q1, q2) = (0,1) und (l1, l2) = (0,1), unabhängig von den Parametern.

— Tim

@Tim Ich glaube, ich verstehe Ihren Standpunkt, aber Ihr Gegenbeispiel erfüllt nicht die von mir angegebenen Bedingungen (zum Beispiel, dass sich die Positionen im offenen Intervall befinden

(0, 1)

$(0,1)$

— Bota

Ich denke, Sie können es numerisch tun (und es wird eine einzigartige Lösung geben), aber es würde einen kleinen Aufwand bedeuten.

— Glen_b -State Monica

Ich denke auch - die numerische Lösung ist nicht schwierig, aber es ist nicht einfach, ein Argument für die Einzigartigkeit zu finden.

— Elvis

@ Elvis tatsächlich, ich vermute, dass es eine Möglichkeit gibt, dies zu tun, indem man sich die Protokolle beider Variablen ansieht (

und

des OP ).

l

$l$

q

$q$

— Glen_b -Rate State Monica

Die Antwort lautet Ja, vorausgesetzt, die Daten erfüllen offensichtliche Konsistenzanforderungen. Das Argument ist einfach und basiert auf einer einfachen Konstruktion, erfordert jedoch einige Einstellungen. Es kommt auf eine intuitiv ansprechende Tatsache an: Durch Erhöhen des Parameters $a$ in einer Beta $(a,b)$ -Verteilung wird der Wert seiner Dichte (PDF) für größeres $x$ stärker erhöht als für kleineres $x$ ; und das Erhöhen von $b$ bewirkt das Gegenteil: Je kleiner $x$ ist, desto mehr steigt der Wert des PDF.

Die Details folgen.

Das gewünschte $q_1$ -Quantil sei $x_1$ und das gewünschte $q_2$ -Quantil sei $x_2$ mit $1 \gt q_2 \gt q_1 \gt 0$ und (daher) $1 \gt x_2 \gt x_1 \gt 0$ . Dann gibt es eindeutige $a$ und $b$ für die die Beta $(a,b)$ -Verteilung diese Quantile hat.

Die Schwierigkeit, dies zu demonstrieren, besteht darin, dass die Beta-Verteilung eine widerspenstige Normalisierungskonstante beinhaltet. Erinnern Sie sich an die Definition: Für $a\gt 0$ und $b \gt 0$ hat die Beta $(a,b)$ -Verteilung eine Dichtefunktion (PDF)

f (x; a, b) = \frac{1}{B (a, b)} x^{a - 1} (1 - x)^{b - 1} .

$f(x;a,b) = \frac{1}{B(a,b)} x^{a-1}(1-x)^{b-1}.$

Die Normalisierungskonstante ist die Beta-Funktion

B (a, b) = \int_{0}^{1} x^{a - 1} (1 - x)^{b - 1} d x = \frac{Γ (a) Γ (b)}{Γ (a + b)} .

$B(a,b) = \int_0^1 x^{a-1}(1-x)^{b-1}\,\mathrm{d}x = \frac{\Gamma(a)\Gamma(b)}{\Gamma(a+b)}.$

Alles wird chaotisch, wenn wir versuchen, $f(x;a,b)$ direkt in Bezug auf $a$ und $b$ , was der Brute-Force-Weg wäre, um eine Demonstration zu versuchen.

Eine Möglichkeit, die Beta-Funktion nicht analysieren zu müssen, besteht darin, zu beachten, dass Quantile relative Bereiche sind. Das ist,

q_{i} = F (x_{i}; a, b) = \frac{\int_{0}^{x_{i}} f (x; a, b) d x}{\int_{0}^{1} f (x; a, b) d x}

$q_i = F(x_i;a,b)=\frac{\int_0^{x_i} f(x;a,b)\,\mathrm{d}x}{\int_0^1 f(x;a,b)\,\mathrm{d}x}$

für $i=1,2$ . Hier sind beispielsweise die PDF und die kumulative Verteilungsfunktion (CDF) $F$ eines Beta $(1.15, 0.57)$ Verteilung , für die $x_1=1/3$ und $q_1=1/6$ .

Links ist die Dichtefunktion $x\to f(x;a,b)$ aufgetragen. $q_1$ ist die Fläche unter der Kurve links von $x_1$ , rot dargestellt, bezogen auf die Gesamtfläche unter der Kurve. $q_2$ ist die Fläche links von $x_2$ , die der Summe der roten und blauen Bereiche entspricht, wiederum relativ zur Gesamtfläche . Die CDF rechts zeigt, wie $(x_1,q_1)$ und $(x_2,q_2)$ markiere zwei verschiedene Punkte darauf.

In dieser Figur ist $(x_1,q_1)$ wurde in festen $(1/3,1/6)$ , $a$ wurde ausgewählt , um $1.15$ , und dann ein Wert von $b$ wurde , für die festgestellt $(x_1,q_1)$ liegt auf die Beta $(a,b)$ CDF.

Lemma : Ein solches $b$ kann immer gefunden werden.

Um genau zu sein, sei $(x_1, q_1)$ ein für alle Mal festgelegt. (Sie bleiben die gleichen in den Abbildungen , die folgen: in allen drei Fällen die relative Fläche links von $x_1$ gleich $q_1$ .) Für jedes $a\gt 0$ , das Lemma behauptet , dass es einen eindeutigen Wert von ist $b$ , geschrieben $b(a),$ für die $x_1$ das $q_1$ -Quantil der Beta ist $(a,b(a))$ Verteilung.

Um zu sehen warum, beachten Sie zuerst, dass sich bei Annäherung von $b$ an Null die gesamte Wahrscheinlichkeit in der Nähe von Werten von $0$ anhäuft, von wo aus $F(x_1;a,b)$ sich $1$ nähert . Wenn sich $b$ Unendlichkeit nähert, häufen sich alle Wahrscheinlichkeiten nahe den Werten von $1$ , von wo aus sich $F(x_1;a,b)$ $0$ nähert . Dazwischen die Funktion $b\to F(x_1;a,b)$ nimmt in $b$ streng zu .

Diese Behauptung ist geometrisch offensichtlich: Wenn wir die Fläche links unter der Kurve $x\to x^{a-1}(1-x)^{b-1}$ relativ zur Gesamtfläche unter der Kurve betrachten und diese mit der vergleichen relative Fläche unter der Kurve $x\to x^{a-1}(1-x)^{b^\prime-1}$ für $b^\prime \gt b$ , dann ist die letztere Fläche relativ größer. Das Verhältnis dieser beiden Funktionen ist $(1-x)^{b^\prime-b}$ . Dies ist eine Funktion gleich $1$ , wenn $x=0,$ stetig zu fallen $0$ , wenn $x=1.$ Daherdie Höhen der Funktion $x\to f(x;a,b^\prime)$ sindrelativ größerals die Höhen von $x\to f(x;a,b)$ für $x$ links von $x_1$ als für $x$ rechts von $x_1.$ Folglich muss dieFlächelinks von $x_1$ im ersterenrelativgrößer sein als die Fläche rechts von $x_1.$ (Dies lässt sich leicht mit einer Riemannschen Summe in ein rigoroses Argument übersetzen.)

Wir haben gesehen , daß die Funktion $b\to f(x_1;a,b)$ ist streng mit Grenzwerten bei monoton steigende $0$ und $1$ als $b\to 0$ und $b\to\infty,$ jeweils. Es ist auch (eindeutig) kontinuierlich. Folglich existiert eine Zahl $b(a)$ mit $f(x_1;a,b(a))=q_1$ und diese Zahl ist einzigartig und beweist das Lemma.

Das gleiche Argument zeigt, dass mit zunehmendem $b$ die Fläche links von $x_2$ zunimmt. Folglich reichen die Werte von $f(x_2;a, b(a))$ über ein Intervall von Zahlen, während $a$ von fast $0$ bis fast $\infty.$ fortschreitet Die Grenze von $f(x_2;a,b(a))$ als $a\to 0$ ist $q_1.$

Hier ist ein Beispiel, in dem $a$ nahe bei $0$ (es entspricht $0.1$ ). Mit $x_1=1/3$ und $q_1=1/6$ (wie in der vorherige Figur), $b(a) \approx 0.02.$ Es gibt fast keinen Bereich zwischen $x_1$ und $x_2:$

Die CDF ist zwischen $x_1$ und $x_2,$ praktisch flach wo aus $q_2$ praktisch über $q_1.$ Im Grenzfall als $a\to 0$ , $q_2 \to q_1.$

Im anderen Extrem führen ausreichend große Werte von $a$ zu $F(x_2;a,b(a))$ beliebig nahe bei $1.$ Hier ist ein Beispiel mit $(x_1,q_1)$ wie zuvor.

Hier ist $a=8$ und $b(a)$ ist fast $10.$ Jetzt ist $F(x_2;a,b(a))$ im Wesentlichen $1:$ Es gibt fast keinen Bereich rechts von $x_2.$

Folglich kann man wählen beliebigen $q_2$ zwischen $q_1$ und $1$ und stellt $a$ bis $F(x_2;a,a(b))=q_2.$ Nach wie vor muss dies $a$ einzigartiges QED sein .

Der Arbeitscode Rzum Finden von Lösungen finden Sie unter Bestimmen der Beta-Verteilungsparameter und aus zwei beliebigen Punkten (Quantilen) $\alpha$ $\beta$ .

— whuber
quelle

Diese Antwort zeigt, dass wir, wenn wir ein festes

oder

haben, einen eindeutigen entsprechenden Wert finden. Es wäre möglich, Funktionen zu konstruieren, die eine feste Fläche in

und

. Ich verstehe nicht sofort, warum dies garantieren würde, dass die Menge von

und

eindeutig ist. Würdest du bereit sein, mich auszuarbeiten und aufzuklären?

a

$a$

b

$b$

[0, x_{1}]

$[0,x_1]$

[x_{1}, x_{2}]

$[x_1,x_2]$

[x_{2}, 1]

$[x_2,1]$

α

$\alpha$

β

$\beta$

— Januar

@ Jan Könnte erklären, was du mit der "Menge von

und

" meinst ? Diese Symbole erscheinen nirgendwo in diesem Thread.

α

$\alpha$

β

$\beta$

— whuber