Wahrscheinlichkeitsräume und Kolmogorovsche Axiome
Ein Wahrscheinlichkeitsraum ist per Definition ein Trippel ( Ω , F , P ), wobei Ω eine Menge von Ergebnissen ist, F eine σ- Algebra auf den Teilmengen von Ω ist und P ein Wahrscheinlichkeitsmaß ist, das die Axiome von Kolmogorov erfüllt, d. H P ist eine Funktion von F bis [ 0 , 1 ], so dass P ( Ω ) = 1 und für disjunkte E 1 , E 2 , …P(Ω,F,P)ΩFσΩPPF[0,1]P(Ω)=1E1,E2,…in gilt, dass P ( ∪ ∞ j = 1 E j ) = & Sigma; ∞ j = 1 P ( E j ) .FP(∪∞j=1Ej)=∑∞j=1P(Ej)
Innerhalb eines solchen Wahrscheinlichkeitsraums kann man für zwei Ereignisse in F die bedingte Wahrscheinlichkeit definieren als P ( E 1 | E 2 ) d e f = P ( E 1 ∩ E 2 )E1,E2FP(E1|E2)=defP(E1∩E2)P(E2)
Beachten Sie, dass:
- Diese bedingte Wahrscheinlichkeit ist nur dann definiert, wenn für F definiert ist. Daher benötigen wir einen Wahrscheinlichkeitsraum, um bedingte Wahrscheinlichkeiten definieren zu können.PF
- Ein Wahrscheinlichkeitsraum ist sehr allgemein definiert ( eine Menge , eine σ- Algebra F und ein Wahrscheinlichkeitsmaß P ). Die einzige Voraussetzung ist, dass bestimmte Eigenschaften erfüllt sein müssen, aber abgesehen davon können diese drei Elemente '' alles '' sein. .Ω σFP
Weitere Details finden Sie in diesem Link
Die Bayes-Regel gilt in jedem (gültigen) Wahrscheinlichkeitsraum
Aus der Definition der bedingten Wahrscheinlichkeit ergibt sich auch, dass . Und aus den beiden letztgenannten Gleichungen ergibt sich die Bayes'sche Regel. So BayesRegel (nach Definition der bedingten probabilty) hält in jedem Wahrscheinlichkeitsraum (es zu zeigen, leitenP(E1∩E2)undP(E2∩E1)aus jeder Gleichung und setzen sie (sie gleich sindweil Schnittpunkt ist kommutativ)). P(E2|E1)=P(E2∩E1)P(E1)P(E1∩E2)P(E2∩E1)
Da die Bayes-Regel die Grundlage für die Bayes'sche Inferenz ist, kann man die Bayes'sche Analyse in jedem gültigen Wahrscheinlichkeitsraum durchführen (dh alle Bedingungen erfüllen, ua Kolmogorovs Axiome).
Häufige Definition der Wahrscheinlichkeit ist ein Sonderfall
Das Obige gilt im Allgemeinen, dh wir haben kein spezifisches , F , P im Sinn, solange F eine σ- Algebra auf Teilmengen von Ω ist und P Kolmogorovs Axiome erfüllt.ΩFPFσΩP
Wir werden nun zeigen, dass eine '' frequentistische '' Definition von Kolomogorovs Axiome erfüllt. Wenn das der Fall ist, dann sind '' frequentistische '' Wahrscheinlichkeiten nur ein Sonderfall von Kolmogorovs allgemeiner und abstrakter Wahrscheinlichkeit. P
Nehmen wir ein Beispiel und würfeln. Dann ist die Menge aller möglichen Ergebnisse beträgt Ω = { 1 , 2 , 3 , 4 , 5 , 6 } . Wir brauchen auch eine σ- Algebra auf dieser Menge Ω und nehmen F die Menge aller Teilmengen von Ω , dh F = 2 Ω .ΩΩ={1,2,3,4,5,6}σΩFΩF=2Ω
PP({1})P({1})=deflimn→+∞n1n 1 n P ( { 2 } ) P ( { 6 } )n11nP({2})P({6})
Auf diese Weise wird für alle Singletons in . Für jede andere Menge in , z. B. , definieren wir häufig, dh
, aber aufgrund der Linearität des 'lim' ist dies gleich , was impliziert, dass Kolmogorovs Axiome gelten.F F { 1 , 2 } P ( { 1 , 2 } ) P ( { 1 , 2 } ) d e f = lim n → + ∞ n 1 + n 2PFF{1,2}P({1,2})P({1,2})=deflimn→+∞n1+n2nP({1})+P({2})
Die häufigste Definition von Wahrscheinlichkeit ist also nur ein Sonderfall von Kolomogorovs allgemeiner und abstrakter Definition eines Wahrscheinlichkeitsmaßes.
Beachten Sie, dass es andere Möglichkeiten gibt, ein Wahrscheinlichkeitsmaß zu definieren, das die Axiome von Kolmogorov erfüllt, sodass die Definition des Frequentisten nicht die einzig mögliche ist.
Fazit
Die Wahrscheinlichkeit in Kolmogorovs axiomatischem System ist "abstrakt", es hat keine wirkliche Bedeutung, es muss nur Bedingungen erfüllen, die "Axiome" genannt werden. Kolmogorov konnte nur mit diesen Axiomen einen sehr reichen Satz ableiten.
Die frequentistische Wahrscheinlichkeitsdefinition erfüllt die Axiome und ersetzt daher das abstrakte, "bedeutungslose" durch eine Wahrscheinlichkeit, die auf eine frequentistische Weise definiert wurde. Alle diese Theoreme sind gültig, da die "frequentistische Wahrscheinlichkeit" nur eine spezielle ist Fall von Kolmogorovs abstrakter Wahrscheinlichkeit (dh es erfüllt die Axiome).P
Eine der Eigenschaften, die in Kolmogorovs allgemeinem Rahmen abgeleitet werden kann, ist die Bayes-Regel. Wie es im allgemeinen und abstrakten Rahmen gilt, gilt (vgl. Oben) auch für den speziellen Fall, dass die Wahrscheinlichkeiten häufig definiert werden (weil die häufig verwendete Definition die Axiome erfüllt und diese Axiome das einzige waren, was dazu benötigt wird alle Sätze ableiten). Man kann also eine Bayes'sche Analyse mit einer frequentistischen Definition der Wahrscheinlichkeit durchführen.
Definieren in einer frequentistischen Weise ist nicht die einzige Möglichkeit, es gibt auch andere Möglichkeiten , um es so zu definieren, dass sie erfüllt die abstrakten Axiome von Kolmogorov. Die Bayes-Regel gilt auch in diesen "Sonderfällen". Man kann also auch eine Bayes'sche Analyse mit einer nicht- häufigen Definition der Wahrscheinlichkeit durchführen.P
EDIT 23.8.2016
@mpiktas Reaktion auf Ihren Kommentar:
Wie gesagt, die Mengen und das Wahrscheinlichkeitsmaß haben im axiomatischen System keine besondere Bedeutung, sie sind abstrakt. Ω,FP
Um diese Theorie anwenden zu können, müssen Sie weitere Definitionen angeben (was Sie also in Ihrem Kommentar sagen , "es ist nicht falsch, es mit einigen bizarren Definitionen zu verwechseln" , Sie benötigen zusätzliche Definitionen ).
Wenden wir es auf den Fall des Werfens einer fairen Münze an. Die Menge in Kolmogorovs Theorie hat keine besondere Bedeutung, sie muss nur eine Menge sein. Wir müssen also angeben, was dieses Set für die faire Münze ist, dh wir müssen das Set . Wenn wir als Kopf H und Schwanz als T darstellen, dann die Gruppe ist definitions .ΩΩΩ Ω=def{H,T}
Wir müssen auch die Ereignisse definieren , dh die -algebra . Wir definieren es als . Es ist leicht zu überprüfen, ob eine Algebra ist.σFF=def{∅,{H},{T},{H,T}}Fσ
Als nächstes müssen wir für jedes Ereignis in sein Maß definieren. So müssen wir definieren eine Karte aus in . Ich werde es auf die häufigste Weise definieren, für eine faire Münze, wenn ich es sehr oft , dann wird der Bruchteil der Köpfe 0,5 sein, also definiere ich . Ebenso definiere ich , und . Beachten Sie, dass eine Map aus in und die Axiome von Kolmogorov erfüllt.E∈FF[0,1]P({H})=def0.5P({T})=def0.5P({H,T})=def1P(∅)=def0PF[0,1]
Eine Referenz mit der Definition der Wahrscheinlichkeit in den Frequentisten finden Sie unter diesem Link (am Ende des Abschnitts 'Definition') und unter diesem Link .