Was ist der Unterschied zwischen und ?


18

Was ist im Allgemeinen der Unterschied zwischen und ?E(X|Y)E(X|Y=y)

Ist früher die Funktion von und letztere die Funktion von ? Es ist so verwirrend ..yx


Hmmm ... Letzteres sollte keine Funktion von x sein, sondern eine Zahl! Liege ich falsch?
David

Antworten:


23

Grob gesagt besteht der Unterschied zwischen und darin, dass die erstere eine Zufallsvariable ist, während die letztere (in gewissem Sinne) eine Realisierung von . Wenn zum Beispiel dann ist die Zufallsvariable Umgekehrt , wenn beobachtet wird, würden wir eher in der Menge interessiert werden die ist ein Skalar.E(XY)E(XY=y)E(XY)

(X,Y.)N(0,(1ρρ1))
E(XY.)
E(XY.)=ρY..
Y.=yE(XY.=y)=ρy

Vielleicht scheint dies eine unnötige Komplikation zu sein, aber als eigenständige Zufallsvariable zu betrachten, macht Dinge wie das Turmgesetz sinnvoll - Das Ding an der Innenseite der Klammern ist zufällig, also können wir fragen, wie es erwartet wird, wohingegen nichts Zufälliges ist . In den meisten Fällen könnten wir hoffen, zu berechnen E ( X ) = E [ E ( X Y ) ] E ( X Y = y ) E ( X Y = y ) = x f X Y ( x y ) d xE(XY.)E(X)=E[E(XY.)]E(XY.=y)

E(XY.=y)=xfXY.(xy) dx

und dann erhalte durch "Einfügen" der Zufallsvariablen anstelle von in den resultierenden Ausdruck. Wie in einem früheren Kommentar angedeutet, gibt es ein bisschen Subtilität, die sich einschleichen kann, wenn es darum geht, wie diese Dinge genau definiert und in geeigneter Weise miteinander verknüpft werden. Dies geschieht aufgrund einiger technischer Probleme mit der zugrunde liegenden Theorie mit bedingter Wahrscheinlichkeit.Y yE(XY.)Y.y


8

Angenommen, und sind Zufallsvariablen.XY.

Sei eine feste reelle Zahl, sagen wir . Dann ist eine Zahl : es ist der bedingte erwartete Wert von vorausgesetzt, dass den Wert . Beachten Sie nun für eine andere feste reelle Zahl , dass , der bedingte erwartete Wert von bei (ein reeller Wert) Nummer). Es gibt keinen Grund anzunehmen, dass undy0y 0 = 1 E [ X | Y = y 0 ] = E [ X | Y = 1 ] X Y 1 y 1 y 1 = 1,5 E [ X | Y = y 1 ] = E [ X | Y = 1,5 ] X Y = 1,5 E [ X Y =y0=1E[XY.=y0]=E[XY.=1]XY.1y1y1=1.5E[XY.=y1]=E[XY.=1.5]XY.=1.5E[XY.=1.5]E[XY.=1]E [ X | Y = y ] g ( y ) y E [ X | Y = y ] E [ X | Y = y ] x E [ X | Y = y ] yhaben den gleichen Wert. Wir können also auch als eine reelle Funktion , die reelle Zahlen auf reelle Zahlen abbildet . Beachten Sie, dass die Aussage in der Frage des OP, dass eine Funktion von ist, falsch ist: ist eine reelle Funktion von .E[XY.=y] G(y)yE[XY.=y]E[XY.=y]xE[XY.=y]y

Andererseits ist eine Zufallsvariable die zufällig eine Funktion der Zufallsvariablen . Wenn wir nun schreiben , meinen wir, dass die Zufallsvariable immer dann den Wert hat , wenn die Zufallsvariable zufällig den Wert hat . Immer wenn den Wert annimmt , nimmt die Zufallsvariable den Wert . Somit ist nur ein anderer Name für die ZufallsvariableE[XY.]Z Y Z = h ( Y ) Y y Z h ( y ) Y Y Z = E [ X | Y ] E [ X | Y = y ] = g ( y ) E [ X | Y ] Z = g ( Y ) E [ X Y ZY.Z=h(Y.)Y.yZh(y)Y.y Z=E[XY.]E[XY.=y]=G(y)E[XY.]Z=G(Y.). Beachten Sie, dass eine Funktion von (nicht wie in der Aussage der OP-Frage).E[XY.]Y.y

Als einfaches anschauliches Beispiel sei angenommen, dass und diskrete Zufallsvariablen mit gemeinsamer Verteilung Beachten Sie, dass und (abhängige) Bernoulli- Zufallsvariablen mit den Parametern bzw. sind und somit und . Nun beachten Sie , dass bedingt auf , ist ein Bernoulli - Zufallsvariable mit Parametern , während konditionierteXY.

P(X=0,Y.=0)=0,1,  P(X=0,Y.=1)=0,2,P(X=1,Y.=0)=0,3,  P(X=1,Y.=1)=0,4.
XY.0,70,6E[X]=0,7E[Y]=0,6Y=0X0,75Y=1X20,70,6E[X]=0,7E[Y.]=0,6Y.=0X0,75bei ist eine Bernoulli-Zufallsvariable mit dem Parameter . Wenn Sie nicht erkennen können, warum dies so ist, müssen Sie nur die Details herausfinden: Zum Beispiel und in ähnlicher Weise für und . Wir haben also Somit ist wobei eine reelle Funktion mit folgenden Eigenschaften ist:Y.=1X23
P(X=1Y=0)=P(X=1,Y=0)P(Y=0)=0.30.4=34,P(X=0Y=0)=P(X=0,Y=0)P(Y=0)=0.10.4=14,
P(X=1Y.=1)P(X=0Y.=1)
E[XY.=0]=34,E[XY.=1]=23.
E[XY.=y]=G(y)G(y)
G(0)=34,G(1)=23.

Andererseits ist eine Zufallsvariable, die die Werte und mit den Wahrscheinlichkeiten und annimmt bzw.. Beachten Sie, dass eine diskrete Zufallsvariable ist, aber keine Bernoulli-Zufallsvariable.E[XY.]=G(Y.)334230,4=P(Y.=0)0,6=P(Y.=1)E[XY.]

Zum Schluss sei angemerkt, dass Das heißt, der erwartete Wert dieser Funktion von , den wir nur unter Verwendung der Randverteilung von berechnet haben, hat zufällig den gleichen numerischen Wert wie !! Dies ist eine Illustration eines allgemeineren Ergebnisses, das viele Leute für eine LÜGE halten:

E[Z]=E[E[XY]]=E[G(Y.)]=0,4×34+0,6×23=0,7=E[X].
YYE[X]E[E[XY]]=E[X].Y.Y.E[X]
E[E[XY.]]=E[X].

Sorry, das ist nur ein kleiner Scherz. LIE ist eine Abkürzung für Law of Iterated Expectation (Gesetz der wiederholten Erwartung). Dies ist ein völlig gültiges Ergebnis, von dem jeder glaubt, dass es die Wahrheit ist.


3

X Y E ( X | Y = y ) X Y = yE(X|Y) ist die Erwartung einer Zufallsvariablen: die Erwartung von , die von abhängig ist . ist andererseits ein bestimmter Wert: der erwartete Wert von wenn .XYE(X|Y=y)XY=y

Stellen Sie sich das so vor: Lassen Sie die Kalorienaufnahme und die Körpergröße darstellen. ist dann die von der Körpergröße abhängige Kalorienaufnahme - und in diesem Fall ist unsere beste Schätzung der Kalorienaufnahme ( ), wenn eine Person eine bestimmte Körpergröße sagen wir mal 180 Zentimeter. XYE(X|Y)E(X|Y=y)XY=y


4
Ich glaube, Ihr erster Satz sollte "Verteilung" durch "Erwartung" (zweimal) ersetzen.
Glen_b

4
ist nicht die Verteilung von X bei gegebenem Y ; Dies wird häufiger durch die bedingte Dichte f X Y ( x y ) oder die bedingte Verteilungsfunktion angegeben. E ( X Y ) ist die bedingte Erwartung von X bei gegebenem Y , einer Y- messbaren Zufallsvariablen. E ( X Y = y )E(XY)XYfXY(xy)E(XY)XYYE(XY=y)Man könnte sich die Realisierung der Zufallsvariablen vorstellen, wenn Y = y beobachtet wird (es besteht jedoch die Möglichkeit, dass sich die meßtheoretische Feinheit einschleicht). E(XY)Y=y
Kerl

1
@guy Deine Erklärung ist die erste genaue Antwort, die bisher gegeben wurde (von drei, die bisher angeboten wurden). Würdest du es als Antwort veröffentlichen?
whuber

@whuber Ich würde, aber ich bin mir nicht sicher, wie ich die Balance zwischen Genauigkeit und einer für OP angemessen nützlichen Antwort finden kann, und ich bin paranoid, wenn es darum geht, technische Probleme zu lösen :)
Typ

@Guy Ich denke du hast schon gute Arbeit mit den technischen Details geleistet. Da Sie sehr sensibel in Bezug auf eine gute Kommunikation mit dem OP sind (was großartig ist!), Sollten Sie ein einfaches Beispiel zur Veranschaulichung anbieten - möglicherweise nur eine gemeinsame Verteilung mit binären Rändern.
whuber

1

ist der erwartete Wert von Werten von X bei gegebenen Werten von Y E ( X | Y = y ) ist der erwartete Wert von X bei gegebenen Werten von Y ist yE(X|Y)XY E(X|Y=y)XYy

Im Allgemeinen ist Wahrscheinlichkeit von Werten X angegebenen Werte Y , aber man kann genauer und sagen P ( X = x | Y = y ) , dh Wahrscheinlichkeit Wert x von allen X 's angesichts der y -te Wert von Y 's. Der Unterschied besteht darin, dass es sich im ersten Fall um "Werte von" handelt und im zweiten um einen bestimmten Wert.P(X|Y)XYP(X=x|Y=y)xXyY

Das folgende Diagramm ist hilfreich.

Bayes-Theorem-Diagramm aus Wikipedia


In dieser Antwort wird die Wahrscheinlichkeit erörtert, während in der Frage nach der Erwartung gefragt wird. Was ist die Verbindung?
whuber
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.