Wenn ich zwei Quantile und ihre entsprechenden Positionen (jeweils) im offenen Intervall gebe , kann ich immer Parameter einer Beta-Verteilung finden, bei der diese Quantile vorliegen die angegebenen Standorte?
Wenn ich zwei Quantile und ihre entsprechenden Positionen (jeweils) im offenen Intervall gebe , kann ich immer Parameter einer Beta-Verteilung finden, bei der diese Quantile vorliegen die angegebenen Standorte?
Antworten:
Die Antwort lautet Ja, vorausgesetzt, die Daten erfüllen offensichtliche Konsistenzanforderungen. Das Argument ist einfach und basiert auf einer einfachen Konstruktion, erfordert jedoch einige Einstellungen. Es kommt auf eine intuitiv ansprechende Tatsache an: Durch Erhöhen des Parameters in einer Beta -Verteilung wird der Wert seiner Dichte (PDF) für größeres stärker erhöht als für kleineres ; und das Erhöhen von bewirkt das Gegenteil: Je kleiner ist, desto mehr steigt der Wert des PDF.
Die Details folgen.
Das gewünschte -Quantil sei und das gewünschte -Quantil sei mit und (daher) . Dann gibt es eindeutige und für die die Beta -Verteilung diese Quantile hat.
Die Schwierigkeit, dies zu demonstrieren, besteht darin, dass die Beta-Verteilung eine widerspenstige Normalisierungskonstante beinhaltet. Erinnern Sie sich an die Definition: Für und hat die Beta -Verteilung eine Dichtefunktion (PDF)
Die Normalisierungskonstante ist die Beta-Funktion
Alles wird chaotisch, wenn wir versuchen, direkt in Bezug auf und , was der Brute-Force-Weg wäre, um eine Demonstration zu versuchen.
Eine Möglichkeit, die Beta-Funktion nicht analysieren zu müssen, besteht darin, zu beachten, dass Quantile relative Bereiche sind. Das ist,
für . Hier sind beispielsweise die PDF und die kumulative Verteilungsfunktion (CDF) eines Beta Verteilung , für die und .
Links ist die Dichtefunktion aufgetragen. ist die Fläche unter der Kurve links von , rot dargestellt, bezogen auf die Gesamtfläche unter der Kurve. ist die Fläche links von , die der Summe der roten und blauen Bereiche entspricht, wiederum relativ zur Gesamtfläche . Die CDF rechts zeigt, wie und markiere zwei verschiedene Punkte darauf.
In dieser Figur ist wurde in festen , wurde ausgewählt , um , und dann ein Wert von wurde , für die festgestellt liegt auf die Beta CDF.
Lemma : Ein solches kann immer gefunden werden.
Um genau zu sein, sei ein für alle Mal festgelegt. (Sie bleiben die gleichen in den Abbildungen , die folgen: in allen drei Fällen die relative Fläche links von gleich .) Für jedes , das Lemma behauptet , dass es einen eindeutigen Wert von ist , geschrieben für die das -Quantil der Beta ist Verteilung.
Um zu sehen warum, beachten Sie zuerst, dass sich bei Annäherung von an Null die gesamte Wahrscheinlichkeit in der Nähe von Werten von anhäuft, von wo aus sich nähert . Wenn sich Unendlichkeit nähert, häufen sich alle Wahrscheinlichkeiten nahe den Werten von , von wo aus sich nähert . Dazwischen die Funktion nimmt in streng zu .
Diese Behauptung ist geometrisch offensichtlich: Wenn wir die Fläche links unter der Kurve relativ zur Gesamtfläche unter der Kurve betrachten und diese mit der vergleichen relative Fläche unter der Kurve für , dann ist die letztere Fläche relativ größer. Das Verhältnis dieser beiden Funktionen ist . Dies ist eine Funktion gleich , wenn stetig zu fallen , wenn Daherdie Höhen der Funktion sindrelativ größerals die Höhen von für links von als für rechts von Folglich muss dieFlächelinks von im ersterenrelativgrößer sein als die Fläche rechts von (Dies lässt sich leicht mit einer Riemannschen Summe in ein rigoroses Argument übersetzen.)
Wir haben gesehen , daß die Funktion ist streng mit Grenzwerten bei monoton steigende und als und jeweils. Es ist auch (eindeutig) kontinuierlich. Folglich existiert eine Zahl mit und diese Zahl ist einzigartig und beweist das Lemma.
Das gleiche Argument zeigt, dass mit zunehmendem die Fläche links von zunimmt. Folglich reichen die Werte von über ein Intervall von Zahlen, während von fast bis fast fortschreitet . Die Grenze von als ist
Hier ist ein Beispiel, in dem nahe bei (es entspricht ). Mit und (wie in der vorherige Figur), Es gibt fast keinen Bereich zwischen und
Die CDF ist zwischen und praktisch flach , von wo aus praktisch über Im Grenzfall als ,
Im anderen Extrem führen ausreichend große Werte von zu beliebig nahe bei Hier ist ein Beispiel mit wie zuvor.
Hier ist und ist fast Jetzt ist im Wesentlichen Es gibt fast keinen Bereich rechts von
Folglich kann man wählen beliebigen zwischen und und stellt bis Nach wie vor muss dies einzigartiges QED sein .
Der Arbeitscode R
zum Finden von Lösungen finden Sie unter Bestimmen der Beta-Verteilungsparameter und β aus zwei beliebigen Punkten (Quantilen) .