Ja, Sie sollten erwarten, dass beide Beispiele (ungewichtet vs. gewichtet) zu den gleichen Ergebnissen führen.
Ich habe die beiden Algorithmen aus dem Wikipedia-Artikel implementiert.
Dieser funktioniert:
Wenn alle aus derselben Verteilung gezogen werden und die ganzzahligen Gewichte die Häufigkeit des Auftretens in der Stichprobe angeben, ist der Schätzer der gewichteten Populationsvarianz gegeben durch:xichwich
s2 = 1V1- 1∑Ni = 1wich( xich- μ∗)2,
Dieser (mit Bruchgewichten) funktioniert jedoch bei mir nicht:
Wenn jedes aus einer Gaußschen Verteilung mit der Varianz , ist der Schätzer einer gewichteten Populationsvarianz gegeben durch:xich1 / wich
s2 = V1V21- V2∑Ni = 1wich( xich- μ∗)2
Ich untersuche immer noch die Gründe, warum die zweite Gleichung nicht wie beabsichtigt funktioniert.
/ EDIT: Ich habe den Grund gefunden, warum die zweite Gleichung nicht so funktioniert, wie ich dachte: Sie können die zweite Gleichung nur verwenden, wenn Sie normalisierte Gewichte oder Varianzgewichte ("Zuverlässigkeit") haben, und sie ist NICHT unvoreingenommen, denn wenn Sie dies nicht tun Verwenden Sie "Wiederholungsgewichte" (Zählen, wie oft eine Beobachtung beobachtet wurde und daher in Ihren mathematischen Operationen wiederholt werden sollte), verlieren Sie die Fähigkeit, die Gesamtzahl der Beobachtungen zu zählen, und können daher keinen Korrekturfaktor verwenden.
Dies erklärt also den Unterschied in Ihren Ergebnissen bei gewichteter und nicht gewichteter Varianz: Ihre Berechnung ist verzerrt.
Wenn Sie also eine unbefangene gewichtete Varianz haben möchten, verwenden Sie nur "wiederholte" Gewichte und verwenden Sie die erste Gleichung, die ich oben angegeben habe. Wenn das nicht möglich ist, können Sie nichts dagegen tun.
Ich habe auch den Wikipedia-Artikel aktualisiert, wenn Sie weitere Informationen wünschen:
http://en.wikipedia.org/wiki/Weighted_arithmetic_mean#Weighted_sample_variance
Und ein verknüpfter Artikel über die unverzerrte gewichtete Kovarianz (die aufgrund der Polarisationsidentität tatsächlich dieselbe Varianz aufweist ):
Korrekte Gleichung für die gewichtete unverzerrte Probenkovarianz