Signifikanztests für Korrelationen
Es gibt Tests von statistischer Signifikanz, die auf einzelne Korrelationen angewendet werden können, die die Wahrscheinlichkeit angeben, eine Korrelation zu erhalten, die größer oder größer als die Stichprobenkorrelation ist, vorausgesetzt, die Nullhypothese ist wahr.
Der entscheidende Punkt ist, dass das, was einen statistisch signifikanten Korrelationskoeffizienten ausmacht, abhängt von:
- Stichprobengröße : Größere Stichprobengrößen führen zu kleineren Schwellenwerten
- Alpha : Oft auf 0,05 eingestellt, führen kleinere Alphas zu höheren Schwellenwerten für die statistische Signifikanz
- einseitiger / zweiseitiger Test : Ich vermute, dass Sie einen zweiseitigen Test verwenden würden, daher spielt dies wahrscheinlich keine Rolle
- Art des Korrelationskoeffizienten : Ich vermute, Sie verwenden Pearson's
- Verteilungsannahmen von x und y
Unter normalen Umständen, wenn Alpha 0,05 ist, unter Verwendung eines zweiseitigen Tests mit Pearson-Korrelation, und wenn Normalität mindestens eine angemessene Annäherung ist, ist der Hauptfaktor, der den Grenzwert beeinflusst, die Stichprobengröße.
Schwelle von Bedeutung
Eine andere Möglichkeit, Ihre Frage zu interpretieren, besteht darin, zu berücksichtigen, dass Sie nicht daran interessiert sind, ob eine Korrelation statistisch signifikant ist, sondern ob sie praktisch wichtig ist.
Einige Forscher haben Faustregeln zur Interpretation der Bedeutung von Korrelationskoeffizienten angeboten, aber diese Faustregeln sind domänenspezifisch.
Multiple Signifikanzprüfung
Da Sie jedoch daran interessiert sind, signifikante Korrelationen in einer Matrix zu kennzeichnen, ändert dies den inferentiellen Kontext. Sie haben Korrelationen, wobei die Anzahl der Variablen ist (dh Wenn die Nullhypothese für alle Korrelationen in der Matrix wahr wäre, dann führen Sie mehr Signifikanztests durch Je wahrscheinlicher es ist, dass Sie einen Fehler vom Typ I machen. In Ihrem Fall würden Sie beispielsweise durchschnittlich Fehler vom Typ I machen, wenn die Nullhypothese für alle Korrelationen wahr wäre.k 14 ( 13 ) / 2 = 91 91 ∗ 0,05 = 4,55k(k−1)/2k14(13)/2=9191∗.05=4.55
Wie @ user603 hervorgehoben hat, wurden diese Probleme in dieser früheren Frage ausführlich erörtert .
Im Allgemeinen finde ich es nützlich, wenn ich eine Korrelationsmatrix interpretiere, um mich auf eine übergeordnete Struktur zu konzentrieren. Dies kann auf informelle Weise erfolgen, indem allgemeine Muster in der Korrelationsmatrix betrachtet werden. Dies kann formal mithilfe von Techniken wie PCA und Faktoranalyse erfolgen. Solche Ansätze vermeiden viele der Probleme, die mit dem Testen mehrerer Signifikanzen verbunden sind.