Intuitive Erklärung für die Dichte der transformierten Variablen?


37

Angenommen, ist eine Zufallsvariable mit pdf . Dann hat die Zufallsvariable das pdfXfX(x)Y=X2

fY(y)={12y(fX(y)+fX(y))y00y<0

Ich verstehe den Kalkül dahinter. Aber ich versuche mir einen Weg zu überlegen, wie ich es jemandem erklären kann, der keinen Kalkül kennt. Insbesondere versuche ich zu erklären, warum der Faktor vorne erscheint. Ich werde es versuchen:1y

Angenommen, X hat eine Gaußsche Verteilung. Fast das ganze Gewicht seiner pdf zwischen den Werten, sagen wir, 3 und 3. Aber , dass die Karten auf 0 bis 9 für Y . Daher wurde das Schwergewicht im PDF für X bei der Umwandlung in Y auf einen größeren Wertebereich ausgedehnt . Damit fY(y) ein wahres PDF ist, muss das extra schwere Gewicht um den multiplikativen Faktor 1 herabgewichtet werden1y

Wie klingt das?

Wenn jemand eine bessere Erklärung für sich oder einen Link in einem Dokument oder Lehrbuch liefern kann, würde ich das sehr begrüßen. Ich finde dieses Variablentransformationsbeispiel in mehreren Büchern mit mathematischen Wahrscheinlichkeits- / Statistikinformationen. Aber ich finde nie eine intuitive Erklärung dafür :(


Ich denke deine Erklärung ist richtig.
HighBandWidth

2
Die Erklärung ist richtig, aber rein qualitativ: Die genaue Form des multiplikativen Faktors ist immer noch ein Rätsel. Die -1 / 2-Potenz erscheint einfach magisch. Auf einer bestimmten Ebene müssen Sie also dasselbe tun wie in Calculus: Ermitteln Sie die Änderungsrate der Quadratwurzelfunktion.
whuber

Antworten:


37

PDFs sind Höhen, aber sie werden verwendet, um die Wahrscheinlichkeit anhand der Fläche darzustellen. Es ist daher hilfreich, ein PDF so auszudrücken, dass wir daran erinnern, dass Fläche gleich Höhe mal Basis ist.

Anfänglich ist die Höhe bei jedem Wert x durch die PDF fX(x) . Die Basis ist das infinitesimale Segment dx , von dem aus die Verteilung ( dh das Wahrscheinlichkeitsmaß im Gegensatz zur Verteilungsfunktion ) in Wirklichkeit die Differentialform oder das "Wahrscheinlichkeitselement" ist.

PEX(x)=fX(x)dx.

Dies ist nicht das PDF, sondern das Objekt, mit dem Sie sowohl konzeptionell als auch praktisch arbeiten möchten, da es explizit alle Elemente enthält, die zum Ausdrücken einer Wahrscheinlichkeit erforderlich sind.

Wenn wir x in Form von y=x2 erneut ausdrücken , werden die Basissegmente dx gedehnt (oder zusammengedrückt): Durch Quadrieren beider Enden des Intervalls von x auf x+dx wir, dass die Basis des y Bereichs sein muss ein längenintervall sein

dy=(x+dx)2x2=2xdx+(dx)2.

Da das Produkt von zwei Infinitesimalen im Vergleich zu den Infinitesimalen selbst vernachlässigbar ist, schließen wir daraus

dy=2xdx, whence dx=dy2x=dy2y.

Nachdem dies festgestellt wurde, ist die Berechnung trivial, da wir nur die neue Höhe und die neue Breite einfügen:

PEX(x)=fX(x)dx=fX(y)dy2y=PEY(y).

Da die Basis, ausgedrückt als y , dy , muss es, was auch immer multipliziert wird, die Höhe sein, die wir mittelfristig als direkt ablesen können

12yfX(y)=fY(y).

Diese Gleichung PEX(x)=PEY(y) ist effektiv eine Erhaltung des Flächengesetzes (= Wahrscheinlichkeitsgesetz).

Zwei PDFs

Diese Grafik zeigt präzise schmale (fast infinitesimale) Teile von zwei PDFs, die durch y=x2 . Wahrscheinlichkeiten werden durch die schattierten Bereiche dargestellt. Aufgrund des Quetschens des Intervalls [0.32,0.45] durch Quadrieren muss die Höhe des roten Bereichs ( y , links) proportional zur Fläche des blauen Bereichs ( x , rechts) vergrößert werden .


2
Ich liebe Infinitesimals. Das ist eine wunderbare Erklärung. Das Denken in Bezug auf das , das eindeutig aus der Ableitung der Transformation hervorgeht, ist viel intuitiver als das Denken in Bezug auf das 2x . Ich denke, da war mein Knackpunkt. y
Lowndrul

@whuber, ich glaube, Sie erste Zeile sollte ? Ist es das, was du mit pdf X ( x ) meinst ? PS: auch neugierig auf deine Gedanken zu meiner Antwort (unten). P(X(x,x+dx))=fx(x)dxpdfX(x)
Carlos Cinelli

@Carlos Es ist etwas strenger, die Idee so auszudrücken, wie ich es eingangs getan habe: Mit dem PDF multiplizieren Sie das Lebesgue-Maß , um das angegebene Wahrscheinlichkeitsmaß zu erhalten. dx
whuber

@whuber aber wenn das pdf ist, was du multiplizierst, dann ist es der Ausdruck , nicht das Produkt f x ( x ) d x, wie du geschrieben hast, oder? Es ist nicht klar, warum Sie das Produkt f X ( x ) d x als pdf bezeichnen. fX(x)fx(x)dxfX(x)dx
Carlos Cinelli

1
@ Carlos: Danke; Jetzt verstehe ich deinen Standpunkt. Ich habe einige Änderungen vorgenommen, um das Problem zu beheben.
whuber

11

Wie wäre es, wenn ich Objekte herstelle, die immer quadratisch sind und die Verteilung der Seitenlängen der Quadrate kenne? Was kann ich über die Verteilung der Flächen der Quadrate sagen?

Was kann ich insbesondere über Y = X 2 sagen , wenn ich die Verteilung einer Zufallsvariablen kenne ? Eine Sache, die Sie sagen können, istXY=X2

FY(c)=P(Yc)=P(X2c)=P(cXc)=FX(c)FX(c).

YX


2
fY

1
Ich verstehe nicht, warum pdf (x) = f (x) dx. Was ist mit pdf (x) dx = f (x), density = prob mass/interval... was mache ich falsch?
Fernando

2

YP(Y(y,y+Δy))Y(y,y+Δy)Δy

XYXY=X2Y(y,y+Δy)X2(x2,(x+Δx)2)X(|x|,|x|+Δx) or X(|x|Δx,|x|)(y,y+Δy)(|x|,|x|+Δx)(|x|Δx,|x|)

P(Y(y,y+Δy))=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))

Ok, jetzt kommen wir zur Dichte. Zuerst müssen wir definieren , was eine Wahrscheinlichkeitsdichte ist. Wie der Name schon sagt, ist es der Anteil der Personen pro Gebiet . Das heißt, wir zählen den Anteil der Personen an diesem Behälter und dividieren ihn durch die Größe des Behälters . Da wir festgestellt haben, dass die Proportionen der Menschen hier gleich sind, sich jedoch die Größe der Behälter geändert hat, ziehen wir den Schluss, dass die Dichte unterschiedlich sein wird. Aber um wie viel anders?

YfY(y):=P(Y(y,y+Δy))ΔyXfX(x):=P(X(x,x+Δx))Δx

Aus unserem vorherigen Ergebnis, dass die Population in jeder Tonne die gleiche ist, haben wir dann, dass

fY(y):=P(Y(y,y+Δy))Δy=P(X(|x|,|x|+Δx))+P(X(|x|Δx,|x|))Δy=fX(|x|)Δx+fX(|x|)ΔxΔy=ΔxΔy(fX(|x|)+fX(|x|))=ΔxΔy(fX(y)+fX(y))

fX(y)+fX(y)ΔxΔyy=x2y+Δy=(x+Δx)2=x2+2xΔx+Δx2ΔxΔx2Δy=2xΔxΔxΔy=12x=12y12y

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.