Die Varianz ist der zweite Moment minus dem Quadrat des ersten Moments, daher reicht es aus, Momente von Gemischen zu berechnen.
Im Allgemeinen ist bei Verteilungen mit PDFs und konstanten (nicht zufälligen) Gewichten das PDF der Mischungfipi
f(x)=∑ipifi(x),
woraus folgt, sofort für jeden Augenblick dassk
μ(k)=Ef[xk]=∑ipiEfi[xk]=∑ipiμ(k)i.
Ich habe für den Moment von und für den Moment von .μ(k)kthfμ(k)ikthfi
Mit diesen Formeln kann die Varianz geschrieben werden
Var(f)=μ(2)−(μ(1))2=∑ipiμ(2)i−(∑ipiμ(1)i)2.
Wenn die Varianzen von als , dann ist . Ermöglichen, dass die Varianz des Gemisches in Bezug auf die Varianzen und Mittel seiner Komponenten als geschrieben wirdfiσ2iμ(2)i=σ2i+(μ(1)i)2f
Var(f)=∑ipi(σ2i+(μ(1)i)2)−(∑ipiμ(1)i)2=∑ipiσ2i+∑ipi(μ(1)i)2−(∑ipiμ(1)i)2.
In Worten ist dies die (gewichtete) durchschnittliche Varianz plus dem durchschnittlichen quadratischen Mittel minus dem Quadrat des durchschnittlichen Mittelwerts. Da Quadrieren eine konvexe Funktion ist, geht Jensens Ungleichung davon aus, dass das durchschnittliche quadratische Mittel nicht kleiner sein kann als das Quadrat des durchschnittlichen Mittels. Dies ermöglicht es uns, die Formel so zu verstehen, dass die Varianz der Mischung die Mischung der Varianzen zuzüglich eines nicht negativen Ausdrucks ist, der die (gewichtete) Streuung der Mittelwerte berücksichtigt.
In Ihrem Fall ist die Varianz
pAσ2A+pBσ2B+[pAμ2A+pBμ2B−(pAμA+pBμB)2].
Wir können interpretieren, dass dies eine gewichtete Mischung der beiden Varianzen ist, , zuzüglich eines (notwendigerweise positiven) Korrekturterms, um die Verschiebungen von den einzelnen Mitteln relativ zum Gesamtmittelwert der Mischung zu berücksichtigen.pAσ2A+pBσ2B
Die Nützlichkeit dieser Varianz bei der Interpretation von Daten, wie sie in der Frage angegeben ist, ist zweifelhaft, da die Mischungsverteilung nicht normal sein wird (und erheblich davon abweichen kann, sofern sie Bimodalität aufweist).