Wie findet man den Mittelwert einer Summe abhängiger Variablen?

Ich weiß, dass der Mittelwert der Summe unabhängiger Variablen die Summe der Mittelwerte jeder unabhängigen Variablen ist. Gilt das auch für abhängige Variablen?

mean non-independent

— Gh75m
quelle

@feetwet, nur das Entfernen von "Danke" ist nicht wirklich wichtig genug, um einen Thread von vor 18 Monaten anzustoßen. FWIW, ich habe dafür gestimmt, diese Änderung abzulehnen (aber 2 andere haben zugestimmt, so dass Sie meinen Kommentar sonst nicht gesehen hätten).

— gung - Wiedereinsetzung von Monica

@gung - Alle möglichen Dinge können mit der Frage "Aktiv" -Ansicht in Konflikt geraten. Ihre Beobachtung wurde oft gemacht, und AFAIKs Richtlinie für Stapelaustausch lautet, dass trotz dieses Nachteils gültige geringfügige Änderungen eine gute Sache sind .

— Feetwet

@feetwet, ich bin mir nicht sicher, wie relevant ein meta.Photography-Beitrag hier ist. Jede SE-Site hat ihre eigenen Metas und ihre eigenen Richtlinien, die von der Community festgelegt werden. Sie könnten an den relevanten meta.CV Fäden aussehen wollen, zum Beispiel diese: „schlug Änderungen“ , um Beiträge Handhabung . Sie werden vielleicht bemerken, wie Whubers Antwort Jeff Atwood zitiert: "Kleine Änderungen, wie ... nur die Anrede aus einem Beitrag zu entfernen. ... sie mit extremen Vorurteilen abzulehnen", und Joran macht den Punkt: "Meine Schwelle für wann eine Bearbeitung ist zu geringfügig und hängt umgekehrt mit dem Alter der Frage zusammen ".

— gung - Wiedereinsetzung von Monica

@gung the Photography post Ich verwies auf Links zu wichtigen und neueren Fragen und Antworten zu Meta Stack Exchange zu diesem Thema . Aber wenn Whubers 4-jährige Antwort immer noch kanonisch für Cross Validated ist, respektiere ich das in Zukunft.

— Feetwet

Antworten:

Erwartung (Mittelwertbildung) ist ein linearer Operator .

Dies bedeutet unter anderem, dass $\mathbb{E}(X + Y) = \mathbb{E}(X) + \mathbb{E}(Y)$ für zwei beliebige Zufallsvariablen $X$ und $Y$ (für die die Erwartungen bestehen), unabhängig davon, ob sie unabhängig sind oder nicht.

Wir können (zB durch verallgemeinern Induktion ) , so daß $\mathbb{E}\left(\sum_{i=1}^n X_i\right) = \sum_{i=1}^n \mathbb{E}(X_i)$ , solange jede Erwartung $\mathbb{E}(X_i)$ existiert.

Also ja, der Mittelwert der Summe ist der gleiche wie der Mittelwert, auch wenn die Variablen abhängig sind. Beachten Sie jedoch, dass dies nicht für die Varianz gilt! Während also $\mathrm{Var}(X + Y) = \mathrm{Var}(X) + \mathrm{Var}(Y)$ für die unabhängigen Variablen, oder auch Variablen, die abhängig , aber nicht korreliert , die allgemeine Formel $\mathrm{Var}(X + Y) = \mathrm{Var}(X) + \mathrm{Var}(Y) + 2\mathrm{Cov}(X, Y)$ , wobei $\mathrm{Cov}$ ist dieKovarianzder Variablen.

— Silberfisch
quelle

TL; DR:
Unter der Annahme, dass es existiert, ist der Mittelwert ein Erwartungswert und der Erwartungswert ein Integral, und die Integrale haben die Linearitätseigenschaft in Bezug auf Summen.

TS; DR:
Da es sich um die Summe der Zufallsvariablen , dh um eine Funktion vieler von ihnen, ist der Mittelwert der Summe in Bezug auf ihre gemeinsame Verteilung ( nehmen wir an , dass alle Mittel vorhanden sind und finite) Bezeichnen die multivariate Vektor der RV, ihre gemeinsame Dichte kann geschrieben werden als $Y_n = \sum_{i=1}^n X_i$ $E(Y_n)$ $\mathbf X$ $n$ und deren Gelenkstütze Nach demGesetz des unbewussten Statistikers haben wir dasmultipleIntegral $f_{\mathbf X}(\mathbf x)= f_{X_1,...,X_n}(x_1,...,x_n)$ $D = S_{X_1} \times ...\times S_{X_n}$

E [Y_{n}] = \int_{D} Y_{n} f_{X} (x) d x

$E[Y_n] = \int_D Y_nf_{\mathbf X}(\mathbf x)d\mathbf x$

Unter bestimmten Regularitätsbedingungen können wir das multiple Integral in ein iteratives Integral zerlegen: $n$

E [Y_{n}] = \int_{S_{X_{n}}} . . . \int_{S_{X_{1}}} [\sum_{i = 1}^{n} X_{i}] f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{n}

$E[Y_n] = \int_{S_{X_n}}...\int_{S_{X_1}}\Big[\sum_{i=1}^n X_i\Big]f_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_n$

und unter Verwendung der Linearität von Integralen, in die wir zerlegen können

= \int_{S_{X_{n}}} . . . \int_{S_{X_{1}}} x_{1} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{n} + . . . . . . + \int_{S_{X_{n}}} . . . \int_{S_{X_{1}}} x_{n} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{n}

$= \int_{S_{X_n}}...\int_{S_{X_1}}x_1f_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_n \; + ...\\ ...+\int_{S_{X_n}}...\int_{S_{X_1}}x_nf_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_n$

For each $n$ -iterative integral we can re-arrange the order of integration so that, in each, the outer integration is with respect to the variable that is outside the joint density. Namely,

\int_{S_{X_{n}}} . . . \int_{S_{X_{1}}} x_{1} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{n} = \int_{S_{X_{1}}} x_{1} \int_{S_{X_{n}}} . . . \int_{S_{X_{2}}} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{2} . . . d x_{n} d x_{1}

$\int_{S_{X_n}}...\int_{S_{X_1}}x_1f_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_n = \\\int_{S_{X_1}}x_1\int_{S_{X_n}}...\int_{S_{X_2}}f_{X_1,...,X_n}(x_1,...,x_n)dx_2...dx_ndx_1$

and in general

\int_{S_{X_{n}}} . . . \int_{S_{X_{j}}} . . . \int_{S_{X_{1}}} x_{j} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{j} . . . d x_{n} =

$\int_{S_{X_n}}...\int_{S_{X_j}}...\int_{S_{X_1}}x_jf_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_j...dx_n =$

= \int_{S_{X_{j}}} x_{j} \int_{S_{X_{n}}} . . . \int_{S_{X_{j - 1}}} \int_{S_{X_{j + 1}}} . . . \int_{S_{X_{1}}} f_{X_{1}, . . ., X_{n}} (x_{1}, . . ., x_{n}) d x_{1} . . . d x_{j - 1} d x_{j + 1} . . . . . . d x_{n} d x_{j}

$=\int_{S_{X_j}}x_j\int_{S_{X_n}}...\int_{S_{X_{j-1}}}\int_{S_{X_{j+1}}}...\int_{S_{X_1}}f_{X_1,...,X_n}(x_1,...,x_n)dx_1...dx_{j-1}dx_{j+1}......dx_ndx_j$

As we calculate one-by-one the integral in each $n$ -iterative integral (starting from the inside), we "integrate out" a variable and we obtain in each step the "joint-marginal" distribution of the other variables. Each $n$ -iterative integral therefore will end up as $\int_{S_{X_j}}x_jf_{X_j}(x_j)dx_j$ .

Bringing it all together we arrive at

E [Y_{n}] = E [\sum_{i = 1}^{n} X_{i}] = \int_{S_{X_{1}}} x_{1} f_{X_{1}} (x_{1}) d x_{1} + . . . + \int_{S_{X_{n}}} x_{n} f_{X_{n}} (x_{n}) d x_{n}

$E[Y_n ] = E[\sum_{i=1}^n X_i] = \int_{S_{X_1}}x_1f_{X_1}(x_1)dx_1 +...+\int_{S_{X_n}}x_nf_{X_n}(x_n)dx_n$

But now each simple integral is the expected value of each random variable separately, so

E [\sum_{i = 1}^{n} X_{i}] = E (X_{1}) + . . . + E (X_{n})

$E[\sum_{i=1}^n X_i] = E(X_1) + ...+E(X_n)$

= \sum_{i = 1}^{n} E (X_{i})

$= \sum_{i=1}^nE(X_i)$

Note that we never invoked independence or non-independence of the random variables involved, but we worked solely with their joint distribution.

— Alecos Papadopoulos
quelle

@ssdecontrol This is one upvote I do appreciate, indeed.

— Alecos Papadopoulos

The expansion into iterated integrals and back again is unnecessary. It complicates a simple argument. You could replace the "TS;DR" section with its last sentence and have a fine answer.

— whuber

@whuber One and a half years later, it still escapes me (I mean, without using the "linearity of the expectation operator" fact, that has already been used by the other answer). Any hint so I can rework the answer towards this simple argument?

— Alecos Papadopoulos

Ich halte das Argument für überflüssig. Der Schlüssel zu dem Ganzen ist Ihre Beobachtung im letzten Satz.

— whuber