Was ist die überraschendste Charakterisierung der Gaußschen (Normal-) Verteilung?


52

Eine standardisierte Gaußsche Verteilung auf kann durch explizite Angabe der Dichte definiert werden: 1R

12πex2/2

oder seine charakteristische Funktion.

Wie in dieser Frage erwähnt, ist es auch die einzige Verteilung, für die der Stichprobenmittelwert und die Varianz unabhängig sind.

Welche andere überraschende alternative Charakterisierung von Gaußschen Maßen kennen Sie? Ich werde die überraschendste Antwort annehmen

Antworten:


39

Mein persönlich überraschendstes Beispiel betrifft den Stichprobenmittelwert und die Varianz, aber hier ist eine weitere (vielleicht) überraschende Charakterisierung: Wenn und IID mit endlicher Varianz sind und und unabhängig sind, sind und normal.Y X + Y X - Y X YXYX+YXYXY

Intuitiv können wir in der Regel anhand eines Streudiagramms feststellen, wenn Variablen nicht unabhängig sind. Stellen Sie sich also ein Streudiagramm von Paaren vor, das unabhängig aussieht. Drehen Sie jetzt um 45 Grad und schauen Sie noch einmal: Wenn es noch unabhängig aussieht, müssen die und Koordinaten einzeln normal sein (das spricht natürlich alles nur für sich).X Y(X,Y)XY

Sehen Sie sich an, warum das intuitive Bit funktioniert

[cos45sin45sin45cos45][xy]=12[xyx+y]

3
Jay - dies ist im Grunde eine Wiederholung der Aussage, dass Mittelwert und Varianz unabhängig sind. ist ein umskalierter Mittelwert und ist eine umskalierte Standardabweichung. X - YX+YXY
Wahrscheinlichkeit

5
@probabilityislogic - Ich mag die Intuition von dem, was Sie gesagt haben, aber ich denke nicht, dass es genau ein Restatement ist, weil nicht genau eine Neuskalierung der SD ist: Die SD vergisst das Vorzeichen. Die Unabhängigkeit von Mittelwert und SD ergibt sich also aus der Unabhängigkeit von , (wenn ), aber nicht umgekehrt. Das war vielleicht das, was Sie unter "im Grunde" verstanden haben. Wie auch immer, es ist gutes Zeug. X + Y X - Y n = 2XYX+YXYn=2

4
Wo können wir Beweise für diese Eigenschaft finden?
Royi

1
@ Royi siehe 16. hier . Beachten Sie für (a), dass . Für (b) beachte, dass was sich nach der Substitution sehnt von dem Sie . Wenn , dann , also für alle , , und es ist eine Sequenz so dass und für alle , was der Kontinuität von bei widersprichtφ ( 2 t ) φ ( - 2 t ) = ( φ ( t ) φ ( - t ) ) 4 ψ ( t ) = φ ( t ) φ ( - t ) ψ ( t ) = ψ 2 2 n2X=(X+Y)+(XY)φ(2t)φ(2t)=(φ(t)φ(t))4ψ(t)=φ(t)φ(t)φ(t0)=0ψ(t0)=0nψ(t0ψ(t)=ψ22n(t2n)φ(t0)=0ψ(t0)=0ntntn0φ(tn)=0nφ0ψ(t02n)=0tntn0φ(tn)=0nφ0. (c) ist geradlinig [Fortsetzung]
Gabriel Romon

1
Für (d) ist . Man beachte, dass , daher ist . Stecken dies in der vorherigen Gleichheit und beweisen , dass für feste , , was bedeutet für alle . Das heißt, ist real, und die Gleichheit in (a) wird zu dem, wonach gefragt wird. Beweisen Sie erneut, dass und verwenden Sie , um . Also ist undφ(t)=1-t2γ(t)=γ2n(t2n)φ(t)=1t22+o(t2)γ(t)=1+o(t2)tγ(t)=1tφφ(t)=φ22n(tlimnγ2n(t2n)=1γ(t)=1tφφ(t)=1-t2φ(t)=φ22n(t2n)limnφ2 2 n (tφ(t)=1t22+o(t2)φ(t)=e-t2/2Xlimnφ22n(t2n)=et2/2φ(t)=et2/2X ist normal.
Gabriel Romon


22

Darüber ist ein ganzes Buch geschrieben: "Charakterisierungen des normalen Wahrscheinlichkeitsgesetzes", AM Mathai & G. Perderzoli. Eine kurze Übersicht in JASA (Dezember 1978) erwähnt Folgendes:

Sei unabhängige Zufallsvariablen. Dann sind und unabhängig, wobei , genau dann, wenn [normal verteilt] ist.n i = 1 a i x in i = 1 b i x i a i b i0 X iX1,,Xni=1naixii=1nbixiaibi0Xi


3
Es muss eine Bedingung wie fehlen. zum Beispiel wenn n = 2 und nicht unabhängig sind. a i = b i = 1 × 1 + X 2 × 1 + X 2<a,b>=0ai=bi=1 X1+X2X1+X2
Robin Girard

1
@ Robin guten Fang. Ich habe auch über die impliziten Quantifizierer gerätselt. Leider habe ich nur Zugriff auf dieses (kitzelnde) Zitat aus der Rezension, nicht auf das Buch. Es würde Spaß machen, es in einer Bibliothek zu finden und darin zu stöbern ...
whuber

Dies fühlt sich an wie eine Verallgemeinerung der Antwort von G. Jay Kerns (derzeit Nummer 1).
VQV

Ich glaube, Sie suchen vielleicht nach der Zeitung von Lukacs & King (1954). Siehe diese Antwort auf math.SE mit einem Link zu dem oben genannten Artikel .
Kardinal

2
Wo dieser Satz sagt "wo ", bedeutet es für JEDEN Satz von Skalaren, wo "? Ich hasse es zu sehen," wo "anstelle von" für alle "oder" für einige "verwendet. Wo "sollte verwendet werden, um die eigene Notation zu erklären, wie in" wo die Lichtgeschwindigkeit und das Bruttoinlandsprodukt ist "usw.a i b i0 c gaibi0aibi0cg
Michael Hardy

17

Gaußsche Verteilungen sind die einzigen summenstabilen Verteilungen mit endlicher Varianz.


8
Dass sie summenstabil sind und dass sie die Einzigen mit endlicher Varianz sind, wird uns beide von der CLT aufgezwungen. Der interessante Teil dieser Behauptung ist, dass es andere summenstabile Verteilungen gibt!
whuber

1
@whuber: in der Tat! Diese Charakterisierung ist etwas verzerrt, und die anderen summenstabilen Verteilungen sind vielleicht merkwürdiger.
Shabbychef

@whuber eigentlich sehe ich nicht, wie der CLT diese Tatsache impliziert. Es scheint uns nur zu sagen, dass asymptotisch die Summe der Normalen normal ist, nicht dass irgendeine endliche Summe normal verteilt ist. Oder musst du irgendwie auch Slutskys Theorem anwenden?
Shabbychef

3
Bei der üblichen Normierung ist eine Summe von zwei Normalen die Summe einer Normalverteilung X_0 plus der Grenzverteilung einer Reihe X_1, X_2, ..., wobei die Summe die Grenzverteilung von X_0, X_1, ... ist, die durch die Lindeberg-Abgabe ist CLT normal.
whuber

17

Stein's Lemma bietet eine sehr nützliche Charakterisierung. ist ein Standard-Gaußscher Wert für für alle absolut stetigen Funktionen mit .E f ' ( Z ) = E Z f ( Z ) f E | f ( Z ) | < Z

Ef(Z)=EZf(Z)
fE|f(Z)|<

12

Theorem [Herschel-Maxwell]: Sei ein Zufallsvektor, für den (i) Projektionen in orthogonale Teilräume unabhängig sind und (ii) die Verteilung von nur von der Länge abhängt. Dann ist normalverteilt. Z Z ZZRnZZZ

Zitiert von George Cobb in Teaching Statistics: Einige wichtige Spannungen (Chilean J. Statistics Vol. 2, Nr. 1, April 2011) auf S. 54.

Cobb verwendet diese Charakterisierung als Ausgangspunkt für die Ableitung der Verteilungen , und , ohne die Verwendung von Calculus (oder viel Wahrscheinlichkeitstheorie). t Fχ2tF


9

Sei und zwei unabhängige Zufallsvariablen mit einer gemeinsamen symmetrischen Verteilung, so dassξηξ

P(|ξ+η2|t)P(|ξ|t).

Dann sind diese Zufallsvariablen Gauß. (Wenn und gauß-zentriert sind, ist dies offensichtlich richtig.)ξη

Dies ist der Bobkov-Houdre-Satz


9

Dies ist keine Charakterisierung, sondern eine Vermutung, die aus dem Jahr 1917 stammt und Cantelli zu verdanken ist:

Wenn ist eine positive Funktion auf und und sind unabhängige Zufallsvariablen , so daß normal ist , dann eine Konstante ist fast überall.fRXYN(0,1)X+f(X)Yf

Erwähnt von Gérard Letac hier .


Es ist gut, dass Sie es erwähnen! Ich kann die Intuition nicht verstehen, oder?
Robin Girard

@robin Das ist es, was diese Vermutung so besonders macht: eine ganz elementare Aussage, einige offensichtliche Ansätze, die kläglich scheitern (charakteristische Funktionen), und man hat nichts zu begreifen ... Sollte man auf die Wahrheit der Vermutung wetten oder falsch? Auch das ist mir nicht klar.
Hat

2
Wenn Gérard Letac es nicht geschafft hat, es zu beweisen, könnte es eine ganze Weile eine offene Vermutung bleiben ...!
Xi'an,

@ Xi'an: Da stimme ich natürlich voll zu. (Wusste nicht, dass Sie in diesen Bereichen des Webs unterwegs sind ... Gute Nachrichten, dass Sie es sind.)
Hat der

6
@ Xi'an Hier ein Preprint von Victor Kleptsyn und Aline Kurtzmann mit einem Gegenbeispiel zur Cantelli-Vermutung. Die Konstruktion verwendet ein neues Werkzeug, das die Autoren den Brownschen Massentransport nennen, und liefert eine diskontinuierliche Funktion . Die Autoren geben an, dass sie glauben, dass die Cantelli-Vermutung zutrifft, wenn man fragt, dass stetig ist (es ist eine Mischung aus zwei stetigen Funktionen). ff
Hat

8

Angenommen, man schätzt einen Standortparameter mit iid-Daten . Wenn der Maximum-Likelihood-Schätzer ist, ist die Stichprobenverteilung Gauß. Nach Jaynes ' Wahrscheinlichkeitstheorie: The Logic of Science, S. 202-4, leitete Gauss sie ursprünglich so ab.{x1,...,xn}x¯


Ich bin mir nicht sicher, ob ich das als Charakterisierung der Normalverteilung verstehe, daher fehlt mir wahrscheinlich etwas. Was wäre, wenn wir Poisson-Daten hätten und schätzen wollten ? Das MLE ist aber die Stichprobenverteilung von ist nicht gaußsch. Erstens muss rational sein. zweitens, wenn es Gaußsch wäre, wäre es aber das ist . μx¯x¯x¯xiPoisson(nμ)
Silverfish

2
Der Poisson-Mittelwert ist kein Standortparameter!
kjetil b halvorsen

6

Eine genauere Charakterisierung der Normalverteilung innerhalb der Klasse der unendlich teilbaren Verteilungen findet sich in Steutel und Van Harn (2004) .

Eine nicht entartete unendlich teilbare Zufallsvariable hat genau dann eine Normalverteilung, wenn sie erfüllt. X

lim supxlogP(|X|>x)xlog(x)=.

Dieses Ergebnis charakterisiert die Normalverteilung hinsichtlich ihres Schwanzverhaltens.


1
Ein kurzer Beweis für die angegebene Grenze lautet wie folgt: Wenn normal ist, dann ist als , also . Aber und so folgt das Ergebnis. Eine grobe Skizze für den Fall des Poisson scheint darauf hinzudeuten, dass der angegebene Grenzwert , aber ich habe das nicht zu genau geprüft. XxP(X>x)/φ(x)1xlogP(X>x)logφ(x)+logx02logφ(x)x2λ
Kardinal

6

Im Rahmen der Bildglättung (zB Skalenraum ) ist der Gaußsche Kern der einzige rotationssymmetrisch trennbare * Kern.

Das heißt, wenn wir benötigen wobei , dann erfordert Rotationssymmetrie entspricht .

F[x,y]=f[x]f[y]
[x,y]=r[cosθ,sinθ]
Fθ=f[x]f[y]xθ+f[x]f[y]yθ=f[x]f[y]y+f[x]f[y]x=0f[x]xf[x]=f[y]yf[y]=const.
log[f[x]]=cx

Voraussetzung dafür, dass ein richtiger Kernel ist, ist, dass die Konstante negativ und der Anfangswert positiv ist, was den Gaußschen Kernel ergibt.f[x]


* Im Kontext von Wahrscheinlichkeitsverteilungen bedeutet separabel unabhängig, während im Kontext von Bildfilterung die 2D-Faltung rechnerisch auf zwei 1D-Faltungen reduziert werden kann.


2
+1 Aber folgt das nicht aus einer unmittelbaren Anwendung des Herschel-Maxwell-Theorems in 2D?
Whuber

@whuber Tatsächlich habe ich es irgendwie geschafft, deine Antwort zu übersehen, wenn ich diesen Thread durchgesehen habe!
Amöbe sagt Reinstate Monica

@whuber Ja. Ich hatte diesen alten Thread nicht im Detail durchgelesen und fügte diese Antwort nur auf Anfrage hinzu.
GeoMatt22

1
@amoeba siehe auch hier .
GeoMatt22

3

Kürzlich veröffentlichte Ejsmont Artikel mit neuer Charakterisierung von Gauß:

Sei unabhängige Zufallsvektoren mit allen Momenten, in denen nicht entartet sind, und sei statistic haben eine Verteilung, die nur von abhängt , wobei und . Dann ist unabhängig und hat die gleiche Normalverteilung mit dem Null und für .(X1,,Xm,Y) and (Xm+1,,Xn,Z)Xii=1naiXi+Y+Zi=1nai2aiR1m<nXii { 1 , , n }cov(Xi,Y)=cov(Xi,Z)=0i{1,,n}

[1] Ejsmont, Wiktor. "Eine Charakterisierung der Normalverteilung durch die Unabhängigkeit eines Paares von Zufallsvektoren." Statistics & Probability Letters 114 (2016): 1-5.


1
Das ist eine delikate und faszinierende Charakterisierung. Vielen Dank, dass Sie diesen Thread durch Teilen verbessert haben!
Whuber

1

Seine charakteristische Funktion hat die gleiche Form wie sein pdf. Ich bin mir nicht sicher, ob dies bei einer anderen Distribution der Fall ist.


4
In dieser meiner Antworten finden Sie Möglichkeiten, Zufallsvariablen zu konstruieren, deren charakteristische Funktionen mit denen ihrer pdfs identisch sind.
Dilip Sarwate

-1

Die Erwartung plus minus der Standardabweichung sind die Sattelpunkte der Funktion.


11
Dies ist zwar eine Eigenschaft der Normal-Distribution, sie kennzeichnet sie jedoch nicht , da auch viele andere Distributionen über diese Eigenschaft verfügen.
Whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.