Der erste Teil der Frage wird in Kommentaren zur Frage beantwortet: Viele "Markennamen" -Distributionen sind multimodal, z. B. jede Beta -Distribution mit a < 1 und b < 1 . Kommen wir zum zweiten Teil der Frage.(a,b)a<1b<1
Alle diskreten Verteilungen sind eindeutig Gemische (von Atomen, die unimodal sind).
Ich werde zeigen, dass die meisten stetigen Verteilungen auch Mischungen von unimodalen Verteilungen sind. Die Intuition dahinter ist einfach: Wir können Unebenheiten eines holprigen PDF-Diagramms nacheinander "abschleifen", bis das Diagramm horizontal ist. Die Unebenheiten werden zu den Mischungskomponenten, von denen jede offensichtlich unimodal ist.
Folglich lautet die Antwort auf die Frage , abgesehen von einigen ungewöhnlichen Verteilungen, deren PDFs höchst diskontinuierlich sind, "keine": Alle multimodalen Verteilungen, die absolut kontinuierlich, diskret oder eine Kombination dieser beiden sind, sind Mischungen von unimodalen Verteilungen.
Betrachten Sie kontinuierliche Verteilungen deren PDFs f kontinuierlich sind (dies sind die "absolut kontinuierlichen" Verteilungen). (Kontinuität ist keine große Einschränkung. Sie kann durch sorgfältige Analyse weiter gelockert werden, vorausgesetzt, die Diskontinuitätspunkte sind diskret.) Ff
Um mit "Plateaus" von konstanten Werten fertig zu werden, die auftreten können, definieren Sie einen "Modus" als ein Intervall (das ein einzelner Punkt sein kann, bei dem x l = x u ), so dassm=[xl,xu]xl=xu
hat einen konstanten Wert für m , sagen wir y .fm,y
ist in keinem Intervall konstant, das ausschließlich m enthält.fm
Es gibt eine positive Zahl so dass der maximale Wert von f, der mit [ x l - ϵ , x u + ϵ ] erreicht wird, gleich y ist .ϵf[xl−ϵ,xu+ϵ]y
Sei ein beliebiger Modus von f . Da f stetig ist, gibt es Intervalle die enthalten, für die in (das ist ein geeignetes Intervall, nicht nur ein Punkt) nicht abnimmt und in nicht zunimmt (das ist auch ein angemessenes Intervall). Sei das Infinimum all dieser Werte und das Supremum all dieser Werte.m=[xl,xu]ffm f [ x ' l , x' l ] [ x u , x ' u ] x ' l x ' u[x′l,x′u]mf[x′l,xl][xu,x′u]x′lx′u
Diese Konstruktion hat einen "Buckel" in dem Graphen von sich von bis . Sei der größere von und . Durch Konstruktion wird die Menge der Punkte in , für die ist eine richtige Intervall streng enthaltend (weil sie entweder die gesamte enthält oder ).x ' l x ' u y f ( x ' l ) f ( x ' u ) x [ x ' l , x ' u ] f ( x ) ≥ y m ' m [ x 'fx′lx′uyf(x′l)f(x′u)x[x′l,x′u]f(x)≥ym′m[xu,x ' u ][x′l,xl][xu,x′u]
In dieser Abbildung eines multimodalen PDF ist ein Modus durch einen roten Punkt auf der horizontalen Achse gekennzeichnet. Die horizontale Ausdehnung des roten Teils der Füllung ist das Intervall : Es ist die Basis des Buckels, die durch die Mode . Die Basis dieses Buckels befindet sich auf der Höhe . Das Original-PDF ist die Summe aus roter und blauer Füllung. Beachten Sie, dass die blaue Füllung nur einen Modus in der Nähe von . Der ursprüngliche Modus bei wurde entfernt.m ' m y ≤ 0,16 2 [ 0 , 0 ]m=[0,0]m′my≈0.162[0,0]
Schreiben vonDefinieren Sie für die Länge vonm '|m′|m′
pm=PrF(m′)−y|m′|
und
fm(x)=f(x)−ypm
wenn und sonst. (Dies macht im Übrigen zu einer stetigen Funktion.) Der Zähler ist der Betrag, um den über ansteigt, und der Nenner ist die Fläche zwischen dem Graphen von und . Somit ist nicht negativ und hat die Gesamtfläche : es ist das PDF einer Wahrscheinlichkeitsverteilung. Durch die Konstruktion hat es einen einzigartigen Modus .f m ( x ) = 0 f m f yx∈m′fm(x)=0fmfy f y f m 1 mpmfyfm1m
Auch vom Aufbau her die Funktion
f′m(x)=f(x)−pmfm(x)1−pm
ist ein PDF zur Verfügung gestellt . (Wenn ist, ist offensichtlich nichts mehr von übrig was unimodal gewesen sein muss.) Außerdem hat es keine Modi im Intervall (wo es konstant ist, weshalb die vorherige sorgfältige Definition von ein Modus als Intervall war notwendig). Außerdem,p m = 1 f , m 'pm<1pm=1f,m′
f(x)=pmfm(x)+(1−pm)f′m(x)
ist eine Mischung aus dem unimodalen PDF und dem PDF .f ' mfmf′m
Iterieren Sie diese Prozedur mit (die als lineare Kombination von stetigen Funktionen immer noch eine stetige Funktion ist und es uns ermöglicht, wie zuvor vorzugehen) und erzeugen Sie eine Folge von Modi ; entsprechende Folgen von Gewichten ; und PDFs Das einschränkende Ergebnis liegt vor, weil (a) das Intervall, in dem abgeflacht ist, ein geeignetes Intervall enthält, das in dem vorhergehenden nicht abgeflacht wurde m = m 1 , m 2 , ... p 1 = p m , p 2 = p m 2 , ... f 1 = f m , f 2 = f m 2 , ... . f i i - 1 ff′mm=m1,m2,…p1=pm,p2=pm2,…f1=fm,f2=fm2,….fii−1Operationen und (b) die reellen Zahlen können nicht in mehr als eine abzählbare Anzahl solcher Intervalle zerlegt werden. Der Grenzwert kann keine Modi haben und ist daher konstant. Er muss Null sein (ansonsten würde sein Integral divergieren). Folglich wurde als Mischung ausgedrückt (möglicherweise nicht eindeutig, da die Reihenfolge, in der die Modi ausgewählt wurden, eine Rolle spielt)f
f(x)=∑ipifi(x)
von unimodalen Verteilungen, QED.