Mittelwertunterschied vs. mittlerer Unterschied


10

Wenn wir zwei unabhängige Stichprobenmittel untersuchen, wird uns gesagt, dass wir den "Unterschied zweier Mittel" betrachten. Dies bedeutet, dass wir den Mittelwert von Population 1 ( ) nehmen und den Mittelwert von Population 2 ( ) davon subtrahieren . Unsere "Differenz zweier Mittel" ist also ( - ).y¯1y¯2y¯1y¯2

Wenn wir gepaarte Stichproben untersuchen, wird uns gesagt, dass wir den "mittleren Unterschied" betrachten, . Dies wird berechnet, indem die Differenz zwischen jedem Paar und dann der Mittelwert aller dieser Unterschiede genommen wird.d¯

Meine Frage ist: Erhalten wir dasselbe ( - ) gegenüber seinem wenn wir sie aus zwei Datenspalten berechnet haben und beim ersten Mal zwei unabhängige Stichproben und beim zweiten Mal als gepaart betrachtet haben Daten? Ich habe mit zwei Datenspalten herumgespielt und es scheint, dass die Werte gleich sind! Kann man in diesem Fall sagen, dass die verschiedenen Namen nur aus nicht quantitativen Gründen verwendet werden?y¯1y¯2d¯


2
Stellen Sie sich das so vor: Wie würden Sie mit ungepaarten Daten berechnen ? d¯
Shadowtalker

3
@ssdecontrol Besonders wenn die Stichprobengrößen unterschiedlich sind.
Alexis

Antworten:


11

(Ich gehe davon aus, dass Sie in Ihrem ersten Absatz "Stichprobe" und nicht "Bevölkerung" meinen.)

Die Äquivalenz ist mathematisch leicht darzustellen. Beginnen Sie mit zwei gleich großen Stichproben: und . Definieren Sie dann{ y 1 , , y n } ˉ x{x1,,xn}{y1,,yn}

x¯=1ni=1nxiy¯=1ni=1nyid¯=1ni=1nxiyi

Dann haben Sie:

x¯y¯=(1ni=1nxi)(1ni=1nyi)=1n(i=1nxii=1nyi)=1n((x1++xn)(y1++yn))=1n(x1++xny1yn)=1n(x1y1++xnyn)=1n((x1y1)++(xnyn))=1ni=1nxiyi=d¯.

1
Aber zwei Konfidenzintervalle, die für "die Differenz der Mittelwerte" und "die mittlere Differenz" berechnet werden, werden unterschiedlich sein, oder? Dies ist an und . Eine gepaarte "mittlere Differenz" unterscheidet sich für (das alles Null ist) von (das nicht alles Null ist); Die Differenz der Mittel bleibt von der Reihenfolge der Elemente unberührt. B = [ . . . , 5 , 4 , 3 , 2 , 1 ] A - A A - B.A=[1,2,3,4,5,...]B=[...,5,4,3,2,1]AAAB
Bers

Ich kann meinen vorherigen Beitrag nicht mehr bearbeiten. Der dritte Satz sollte „Eine Folge von gepaart‚mittleren Differenzen‘...“ beginnen
Bers

@bers was hat damit zu tun? AA
Shadowtalker

Es sei angenommen . Dann sind und zwei verschiedene Sequenzen. Das Konfidenzintervall für die mittlere gepaarte Differenz wird in beiden Fällen sicherlich unterschiedlich sein. Aber die Differenz der Mittelwerte und damit das Konfidenzintervall ist sowohl für als auch für indentisch . Oder liege ich falsch? A - C A - B A - C A - B.C=AACABACAB
Bers

@bers Ich denke, Sie sind verwirrt, aber ich bin verwirrt darüber, worüber Sie verwirrt sind.
Shadowtalker

0

Die Verteilung der mittleren Differenz sollte enger sein als die Verteilung der Mittelwertdifferenz. Sehen Sie dies anhand eines einfachen Beispiels: Mittelwert in Probe 1: 1 10 100 1000 Mittelwert in Probe 2: 2 11 102 1000 Mittelwertdifferenz ist 1 1 2 0 (im Gegensatz zu Proben selbst) hat einen kleinen Standard.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.