Gibt es eine plateauförmige Verteilung?


30

Ich bin auf der Suche nach einer Verteilung, bei der die Wahrscheinlichkeitsdichte nach einem Punkt, der vom Mittelwert abweicht, schnell abnimmt, oder nach meinen eigenen Worten nach einer "plateauförmigen Verteilung".

Etwas zwischen der Gaußschen und der Uniform.


8
Sie könnten ein Gaußsches Wohnmobil und ein einheitliches Wohnmobil addieren.
StrongBad

3
Man hört manchmal von sogenannten platykurtischen Verteilungen.
JM ist kein Statistiker

Antworten:


53

Möglicherweise suchen Sie nach Verteilungen, die unter den Bezeichnungen generalisierte Normalverteilung (Version 1) , Subbotinverteilung oder Exponentialverteilung bekannt sind. Es wird durch Position , Skalierung und Form mit PDF parametrisiertσ βμσβ

β2σΓ(1/β)exp[(|xμ|σ)β]

Wie Sie sehen können, ähnelt es bei der Laplace-Verteilung und konvergiert mit ihr, bei konvergiert es zur Normalverteilung und bei zur Gleichverteilung.β = 2 β = β=1β=2β=

Bildbeschreibung hier eingeben

Wenn Sie nach Software suchen, für die diese implementiert ist, können Sie die normalpBibliothek auf R prüfen (Mineo und Ruggieri, 2005). Das Schöne an diesem Paket ist, dass es unter anderem eine Regression mit generalisierten normalverteilten Fehlern implementiert, dh die Norm minimiert .Lp


Mineo, AM & Ruggieri, M. (2005). Ein Software-Tool für die exponentielle Energieverteilung: Das Paket normalp. Journal of Statistical Software, 12 (4), 1-24.


20

@ StrongBads Kommentar ist ein wirklich guter Vorschlag. Die Summe aus einem einheitlichen RV und einem Gaußschen RV kann genau das liefern, wonach Sie suchen, wenn Sie die richtigen Parameter auswählen. Und es hat tatsächlich eine einigermaßen schöne geschlossene Formlösung.

Das pdf dieser Variablen ergibt sich aus dem Ausdruck:

14a[erf(x+aσ2)erf(xaσ2)]

σa ist der "Radius" der mittleren Null-Gleichförmigkeit RV. ist die Standardabweichung des mittleren Null-Gauß-RV.σ

PDFs


3
Referenz: Bhattacharjee, GP, Pandit, SNN und Mohan, R. 1963. Maßketten mit rechteckiger und normaler Fehlerverteilung. Technometrics, 5, 404–406.
Tim

15

Es gibt unendlich viele "plateauförmige" Verteilungen.

Warst du nach etwas Spezifischerem als "Zwischen Gauß und Uniform"? Das ist etwas vage.

Hier ist eine einfache: Sie könnten immer eine Halbnormale an jedes Ende einer Uniform kleben:

Dichte mit gleichförmiger Mitte und Gaußschen Schwänzen

Sie können die "Breite" der Uniform in Bezug auf die Normalskala so steuern, dass Sie breitere oder schmalere Plateaus haben, was eine ganze Klasse von Verteilungen ergibt, einschließlich der Gaußschen und der Uniform als Grenzfälle.

Die Dichte beträgt:

h2πσe12σ2(xμ+w/2)2Ixμw/2+h2πσIμw/2<xμ+w/2+h2πσe12σ2(xμw/2)2Ix>μ+w/2

Wobeih=11+w/(2πσ)

Als für festes nähern wir uns der Uniform an und als für festes nähern wir uns .σ0w(μw/2,μ+w/2)w0σN(μ,σ2)

Hier einige Beispiele (jeweils mit ):μ=0

Handlung verschiedener Beispiele dieser Uniform mit Gaußschwanz

Wir könnten diese Dichte vielleicht als "Uniform mit Gaußschwanz" bezeichnen.


1
Ach! Ich liebe es, an formellen Bällen teilzunehmen, die eine Gauß-Uniform tragen! ;)
Alexis

7

Siehe meine "Devil's Tower" -Verteilung hier [1]:

f(x)=0.3334 für ; für ; und für.|x|<0.9399
f(x)=0.2945/x20.9399|x|<2.3242
f(x)=02.3242|x|

Devil's Tower Density Funktion mit flacher Oberseite, konvexen Seiten, die an den Extremen abgeschnitten sind

Noch interessanter ist die Verteilung "Slip-Dress".

Es ist einfach, Verteilungen mit jeder gewünschten Form zu konstruieren.

[1]: Westfall, PH (2014)
"Kurtosis as Peakedness, 1905 - 2014. RIP"
Am. Stat. 68 (3): 191–195. doi: 10.1080 / 00031305.2014.917055
public access pdf: http://www.ncbi.nlm.nih.gov/pmc/articles/PMC4321753/pdf/nihms-599845.pdf


Hallo Peter, ich habe mir die Freiheit genommen, die Funktion und das Einfügen eines Bildes sowie eine vollständige Referenz anzugeben. (Wenn das Gedächtnis es zulässt, denken ich, dass Kendall und Stuart in ihrem klassischen Text die Details einer ähnlichen Entlarvung wiedergeben. Wenn ich mich recht erinnere - es ist eine lange Zeit her -, glaube ich, diskutieren sie auch, dass es keine Schwergängigkeit ist.)
Glen_b -Reinstate Monica

Danke, Glen_b. Ich habe nie gesagt, dass Kurtosis misst, was die Schwanzindexzahlen messen. Mein Artikel beweist vielmehr, dass Kurtosis für eine sehr breite Klasse von Verteilungen fast gleich E ist (Z ^ 4 * I (| Z |> 1)). Die Kurtosis sagt also nichts über den 'Peak' aus, der typischerweise im Bereich {Z: | Z | liegt <1}. Vielmehr wird es meist durch die Schwänze bestimmt. Nenne es E (Z ^ 4 * I (| Z |> 1)), wenn der Begriff "Schwerfälligkeit" eine andere Bedeutung hat.
Peter Westfall

@ Glen_b, auf welchen Tail-Index beziehen Sie sich? Es gibt unendlich viele. Schwanzkreuzungen definieren "Schweif" nicht richtig. Gemäß einigen Schwanzkreuzungsdefinitionen der Schwanzschwere ist N (0,1) "schwerer" als 0,9999 · U (-1,1) + 0,0001 · U (-1000,1000), obwohl dies der Fall ist offensichtlich schwerer, trotz endlicher Schwänze. Übrigens weist letztere im Gegensatz zu N (0,1) eine extrem hohe Kurtosis auf.
Peter Westfall

Ich kann mich nirgendwo in meinem Kommentar finden, wo ich "tail index" sage. Ich bin nicht ganz sicher, worauf Sie sich dort beziehen, wenn Sie sagen, auf welchen Endindex Sie sich beziehen. Wenn Sie das bisschen von Schwerschwanzigkeit meinen, ist das Beste, was Sie tun können, zu überprüfen, was Kendall und Stuart tatsächlich sagen. Ich glaube, dass sie dort tatsächlich das asymptotische Verhältnis der Dichten für symmetrische standardisierte Variablen vergleichen, aber es könnten vielleicht Überlebensfunktionen gewesen sein; der Punkt war ihrer, nicht meiner
Glen_b -Reinstate Monica

Seltsam. Nun, auf jeden Fall haben Kendall und Stuart es falsch verstanden. Die Kurtosis ist offensichtlich ein Maß für das Schwanzgewicht, wie meine Theoreme beweisen.
Peter Westfall

5

Viele nette Antworten. Die hier angebotene Lösung weist zwei Merkmale auf: (i) dass sie eine besonders einfache funktionale Form aufweist und (ii) dass die resultierende Verteilung notwendigerweise ein plateau-förmiges PDF erzeugt (nicht nur als Sonderfall). Ich bin mir nicht sicher, ob dies bereits einen Namen in der Literatur hat, aber ohne denselben, nennen wir es eine Plateau-Distribution mit pdf :f(x)

f(x)=k11+x2afor xR

woher:

  • Parameter ist eine positive ganze Zahl unda
  • k ist eine Integrationskonstante: k=aπsin(π2a)

Hier ist eine grafische Darstellung des PDF-Dokuments für verschiedene Werte von Parameter :a

Bildbeschreibung hier eingeben

.

Wenn der Parameter groß wird, tendiert die Dichte zu einer gleichmäßigen (-1,1) Verteilung. Das folgende Diagramm ist auch mit einem Standard-Normal (grau gestrichelt) vergleichbar:a

Bildbeschreibung hier eingeben


3

Ein anderes ( EDIT : Ich habe es jetzt vereinfacht. EDIT2 : Ich habe es noch weiter vereinfacht, obwohl das Bild jetzt nicht wirklich diese exakte Gleichung widerspiegelt):

f(x)=13αlog(cosh(αa)+cosh(αx)cosh(αb)+cosh(αx))

Klobig, ich weiß, aber hier habe ich die Tatsache ausgenutzt, dass sich einer Linie nähert, wenn zunimmt.xlog(cosh(x))x

Grundsätzlich haben Sie die Kontrolle darüber, wie glatt der Übergang ist ( ). Wenn und garantiere ich, dass es eine gültige Wahrscheinlichkeitsdichte ist (summiert sich zu 1). Wenn Sie andere Werte wählen, müssen Sie diese neu normieren.a = 2 b = 1alphaa=2b=1


Hier ist ein Beispielcode in R:

f = function(x, a, b, alpha){
  y = log((cosh(2*alpha*pi*a)+cosh(2*alpha*pi*x))/(cosh(2*alpha*pi*b)+cosh(2*alpha*pi*x)))
  y = y/pi/alpha/6
  return(y)
}

fist unsere Distribution. Zeichnen wir es für eine Sequenz vonx

plot(0, type = "n", xlim = c(-5,5), ylim = c(0,0.4))
x = seq(-100,100,length.out = 10001L)

for(i in 1:10){
  y = f(x = x, a = 2, b = 1, alpha = seq(0.1,2, length.out = 10L)[i]); print(paste("integral =", round(sum(0.02*y), 3L)))
  lines(x, y, type = "l", col = rainbow(10, alpha = 0.5)[i], lwd = 4)
}
legend("topright", paste("alpha =", round(seq(0.1,2, length.out = 10L), 3L)), col = rainbow(10), lwd = 4)

Konsolenausgabe:

#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = 1"
#[1] "integral = NaN" #I suspect underflow, inspecting the plots don't show divergence at all
#[1] "integral = NaN"
#[1] "integral = NaN"

Und Handlung:

Meine Distribution basiert auf log cosh

Sie könnten ändern aund bungefähr den Anfang bzw. das Ende der Steigung, aber dann wäre eine weitere Normalisierung erforderlich, und ich habe es nicht berechnet (aus diesem Grund verwende ich a = 2und b = 1im Plot).


2

Wenn Sie etwas sehr Einfaches suchen, mit einem zentralen Plateau und den Seiten einer Dreiecksverteilung, können Sie beispielsweise N Dreiecksverteilungen kombinieren, wobei N vom gewünschten Verhältnis zwischen Plateau und Abstieg abhängt. Warum Dreiecke, weil ihre Abtastfunktionen in den meisten Sprachen bereits existieren. Sie sortieren nach dem Zufallsprinzip aus einem von ihnen.

In R würde das ergeben:

library(triangle)
rplateau = function(n=1){
  replicate(n, switch(sample(1:3, 1), rtriangle(1, 0, 2), rtriangle(1, 1, 3), rtriangle(1, 2, 4)))
}
hist(rplateau(1E5), breaks=200)

Bildbeschreibung hier eingeben Bildbeschreibung hier eingeben


2

Hier ist eine schöne: das Produkt von zwei logistischen Funktionen.

(1/B) * 1/(1+exp(A*(x-B))) * 1/(1+exp(-A*(x+B)))

Dies hat den Vorteil, nicht stückweise zu sein.

B stellt die Breite und A die Steilheit des Abfalls ein. Dargestellt sind B = 1: 6 mit A = 2. Hinweis: Ich habe mir nicht die Zeit genommen, um herauszufinden, wie ich das richtig normalisieren kann.

Plateau-Verteilung

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.