Statistisch signifikant vs. unabhängig / abhängig


9

Was ist der Unterschied zwischen statistisch signifikantem Wert (z. B. einem Unterschied zwischen zwei Stichproben) und der Angabe, ob eine Gruppe von Zahlen unabhängig oder abhängig ist?

Antworten:


9

Die Signifikanz in einem t-Test mit unabhängigen Stichproben bedeutet lediglich, dass die Wahrscheinlichkeit (wenn die Null wahr wäre), eine so extreme mittlere Differenz wie die tatsächlich abgetastete mittlere Differenz abzutasten, weniger als 0,05 beträgt.

Dies ist völlig unabhängig von abhängig / unabhängig. "Abhängig" bedeutet, dass die Verteilung einiger einzelner Beobachtungen mit der Verteilung anderer verbunden ist, zum Beispiel A) sie sind dieselbe Person, die denselben Test ein zweites Mal durchführt, B) Personen in jeder Gruppe werden auf eine Variable vor dem Test abgestimmt, C) Personen in den beiden Gruppen sind verwandt (dh Familie). "Unabhängig" bedeutet, dass keine solche Verbindung besteht.


1
Es ist auch zu beachten, dass p = 0,05 eine etwas willkürliche Schwelle ist. Wenn Sie der Meinung sind, dass 1:20 eine zu hohe Wahrscheinlichkeit für ein falsches Positiv ist, sollte Ihr p niedriger sein.
naught101

9

Warum bei Tests anhalten?t

Sie können sich zwei Variablen als zwei orthogonale Vektoren vorstellen, die genau wie die und y- Achse in einem zweidimensionalen kartesischen Koordinatensystem unkorreliert sind.xy

Wenn einer von zwei Vektoren, sagen wir und y, mit dem anderen korreliert ist, gibt es einen bestimmten Teil von x, der auf y projiziert werden kann und umgekehrt. In diesem Sinne ist es ziemlich leicht zu sehen, dass seitdemxy

x,y=xycos(θ)x,yxy=cos(θ)=r

Dabei ist Pearson-Korrelationskoeffizient und das innere Produkt der Argumente. Als ich das erfuhr, war ich total begeistert davon, wie geometrisch einfach die Idee der Korrelation ist. Und dies ist definitiv nicht die einzige Möglichkeit, die Korrelation zwischen zwei (oder mehr) Variablen zu messen., r,

Signifikanztests sind ein anderes Ballspiel. Oft möchten wir wissen, um wie viel sich zwei (oder mehr) Gruppen in einer Ergebnisvariablen aufgrund einer Manipulation unterscheiden, die an diesen Gruppen durchgeführt wurde. Wie Brian sagte, möchten Sie wissen, ob die beiden Gruppen aus derselben Verteilung stammen, und berechnen daher die Wahrscheinlichkeit, die mittlere Differenz (skaliert mit dem Standardfehler des Mittelwerts) abzutasten, die Sie aus Ihrem Experiment erhalten haben, unter Berücksichtigung der Nullhypothese (es gibt keinen signifikanten Unterschied in den Mitteln) ist wahr. Wenn in der Verhaltensforschung (und oft auch anderswo) diese Wahrscheinlichkeit weniger als 0,05 beträgt, können Sie daraus schließen, dass der Unterschied zwischen den beiden (oder mehr) Mitteln wahrscheinlich auf Ihre Manipulation zurückzuführen ist.

EDIT : Dilip Sarwate wies darauf hin, dass zwei unkorrelierte Variablen statistisch abhängig sein können, also nahm ich den ersten Teil heraus. Dank dafür.


Wow, mein mathematischer Hintergrund ist weit fortgeschrittener als mein Statistikhintergrund. Ich finde das eine wirklich intuitive Art, Pearsons r zu verstehen. Diese Antwort ist wirklich hilfreich, danke!
naught101

Besonders das Konzept, dass Kovarianz nur ein inneres Produkt ist!
naught101

2
-1 für "Sie können sich vorstellen, dass zwei Variablen unabhängig sind (manchmal auch als unkorreliert bezeichnet)" Unabhängigkeit ist nicht dasselbe wie unkorreliert; unkorrelierte Zufallsvariablen können sehr stark abhängig sein.
Dilip Sarwate

OK, danke, dass Sie das Problem behoben haben. Ich kehre meine Abstimmung zurück.
Dilip Sarwate
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.