Antworten:
Grob gesagt besteht der Unterschied zwischen und darin, dass die erstere eine Zufallsvariable ist, während die letztere (in gewissem Sinne) eine Realisierung von . Wenn zum Beispiel dann ist die Zufallsvariable Umgekehrt , wenn beobachtet wird, würden wir eher in der Menge interessiert werden die ist ein Skalar.
Vielleicht scheint dies eine unnötige Komplikation zu sein, aber als eigenständige Zufallsvariable zu betrachten, macht Dinge wie das Turmgesetz sinnvoll - Das Ding an der Innenseite der Klammern ist zufällig, also können wir fragen, wie es erwartet wird, wohingegen nichts Zufälliges ist . In den meisten Fällen könnten wir hoffen, zu berechnen E ( X ) = E [ E ( X ≤ Y ) ] E ( X ≤ Y = y ) E ( X ≤ Y = y ) = ≤ x f X ≤ Y ( x ≤ y ) d x
und dann erhalte durch "Einfügen" der Zufallsvariablen anstelle von in den resultierenden Ausdruck. Wie in einem früheren Kommentar angedeutet, gibt es ein bisschen Subtilität, die sich einschleichen kann, wenn es darum geht, wie diese Dinge genau definiert und in geeigneter Weise miteinander verknüpft werden. Dies geschieht aufgrund einiger technischer Probleme mit der zugrunde liegenden Theorie mit bedingter Wahrscheinlichkeit.Y y
Angenommen, und sind Zufallsvariablen.
Sei eine feste reelle Zahl, sagen wir . Dann ist eine Zahl : es ist der bedingte erwartete Wert von vorausgesetzt, dass den Wert . Beachten Sie nun für eine andere feste reelle Zahl , dass , der bedingte erwartete Wert von bei (ein reeller Wert) Nummer). Es gibt keinen Grund anzunehmen, dass undy 0 = 1 E [ X | Y = y 0 ] = E [ X | Y = 1 ] X Y 1 y 1 y 1 = 1,5 E [ X | Y = y 1 ] = E [ X | Y = 1,5 ] X Y = 1,5 E [ X ∣ Y =E [ X | Y = y ] g ( y ) y E [ X | Y = y ] E [ X | Y = y ] x E [ X | Y = y ] yhaben den gleichen Wert. Wir können also auch als eine reelle Funktion , die reelle Zahlen auf reelle Zahlen abbildet . Beachten Sie, dass die Aussage in der Frage des OP, dass eine Funktion von ist, falsch ist: ist eine reelle Funktion von .
Andererseits ist eine Zufallsvariable die zufällig eine Funktion der Zufallsvariablen . Wenn wir nun schreiben , meinen wir, dass die Zufallsvariable immer dann den Wert hat , wenn die Zufallsvariable zufällig den Wert hat . Immer wenn den Wert annimmt , nimmt die Zufallsvariable den Wert . Somit ist nur ein anderer Name für die ZufallsvariableZ Y Z = h ( Y ) Y y Z h ( y ) Y Y Z = E [ X | Y ] E [ X | Y = y ] = g ( y ) E [ X | Y ] Z = g ( Y ) E [ X ∣ Y . Beachten Sie, dass eine Funktion von (nicht wie in der Aussage der OP-Frage).
Als einfaches anschauliches Beispiel sei angenommen, dass
und diskrete Zufallsvariablen mit gemeinsamer Verteilung
Beachten Sie, dass und (abhängige) Bernoulli- Zufallsvariablen mit den Parametern bzw. sind und somit
und . Nun beachten Sie , dass bedingt auf , ist ein Bernoulli - Zufallsvariable mit Parametern , während konditionierte
Andererseits ist eine Zufallsvariable, die die Werte und mit den Wahrscheinlichkeiten und annimmt bzw.. Beachten Sie, dass eine diskrete Zufallsvariable ist, aber keine Bernoulli-Zufallsvariable.3
Zum Schluss sei angemerkt, dass
Das heißt, der erwartete Wert dieser Funktion von , den wir nur unter Verwendung der Randverteilung von berechnet haben, hat zufällig den gleichen numerischen Wert wie !! Dies ist eine Illustration eines allgemeineren Ergebnisses, das viele Leute für eine LÜGE halten:
Sorry, das ist nur ein kleiner Scherz. LIE ist eine Abkürzung für Law of Iterated Expectation (Gesetz der wiederholten Erwartung). Dies ist ein völlig gültiges Ergebnis, von dem jeder glaubt, dass es die Wahrheit ist.
X Y E ( X | Y = y ) X Y = y ist die Erwartung einer Zufallsvariablen: die Erwartung von , die von abhängig ist . ist andererseits ein bestimmter Wert: der erwartete Wert von wenn .
Stellen Sie sich das so vor: Lassen Sie die Kalorienaufnahme und die Körpergröße darstellen. ist dann die von der Körpergröße abhängige Kalorienaufnahme - und in diesem Fall ist unsere beste Schätzung der Kalorienaufnahme ( ), wenn eine Person eine bestimmte Körpergröße sagen wir mal 180 Zentimeter.
ist der erwartete Wert von Werten von X bei gegebenen Werten von Y E ( X | Y = y ) ist der erwartete Wert von X bei gegebenen Werten von Y ist y
Im Allgemeinen ist Wahrscheinlichkeit von Werten X angegebenen Werte Y , aber man kann genauer und sagen P ( X = x | Y = y ) , dh Wahrscheinlichkeit Wert x von allen X 's angesichts der y -te Wert von Y 's. Der Unterschied besteht darin, dass es sich im ersten Fall um "Werte von" handelt und im zweiten um einen bestimmten Wert.
Das folgende Diagramm ist hilfreich.