Welche robusten Korrelationsmethoden werden tatsächlich verwendet?


18

Ich plane eine Simulationsstudie, in der ich die Leistung mehrerer robuster Korrelationstechniken mit unterschiedlichen Verteilungen (verzerrt, mit Ausreißern usw.) vergleiche. Mit robust meine ich den Idealfall, robust gegen a) verzerrte Verteilungen, b) Ausreißer und c) schwere Schwänze zu sein.

Zusammen mit der Pearson-Korrelation als Grundlinie wollte ich folgende robustere Maßnahmen einbeziehen:

  • Spearman'sρ
  • Prozentuale Biegekorrelation (Wilcox, 1994, [1])
  • Minimales Volumenellipsoid, minimale Kovarianzdeterminante ( cov.mve/ cov.mcdmit der cor=TRUEOption)
  • Wahrscheinlich die wonorisierte Korrelation

Natürlich gibt es viel mehr Möglichkeiten (besonders, wenn Sie auch robuste Regressionstechniken einbeziehen), aber ich möchte mich auf die meist verwendeten / meist vielversprechenden Ansätze beschränken.

Jetzt habe ich drei Fragen (zögern Sie nicht, nur einzelne zu beantworten):

  1. Gibt es andere robuste Korrelationsmethoden, die ich einbeziehen könnte / sollte?
  2. Welche robusten Korrelationstechniken werden in Ihrem Bereich tatsächlich verwendet? (Apropos psychologische Forschung: Außer Spearman's ich noch nie eine zuverlässige Korrelationstechnik außerhalb eines Fachartikels gesehen. Bootstrapping wird immer beliebter, andere zuverlässige Statistiken gibt es jedoch bislang so gut wie nicht.)ρ
  3. Gibt es bereits systematische Vergleiche von bekannten Mehrfachkorrelationstechniken?

Sie können auch die Liste der oben angegebenen Methoden kommentieren.


[1] Wilcox, RR (1994). Der prozentuale Biegekorrelationskoeffizient. Psychometrika , 59, 601 & ndash; 616.

Antworten:


3

Aus psychologischer Sicht scheint die Korrelation zwischen Pearson und Spearman die häufigste zu sein. Ich denke jedoch, dass sich viele Forscher in der Psychologie mit verschiedenen Datenmanipulationsverfahren für konstituierende Variablen beschäftigen, bevor Pearson's Korrelation durchgeführt wird. Ich stelle mir vor, dass bei jeder Prüfung der Robustheit die folgenden Auswirkungen berücksichtigt werden sollten:

  • Transformationen einer oder beider Variablen, um Variablen einer Normalverteilung anzunähern
  • Anpassung oder Löschung von Ausreißern aufgrund einer statistischen Regel oder Kenntnis von Problemen mit einer Beobachtung

1

Ich würde Ihnen diesen hervorragenden Artikel empfehlen, der 2011 in Science veröffentlicht wurde und den ich zuvor hier gepostet habe. Es gibt Vorschläge für eine neue robuste Maßnahme sowie einen umfassenden und hervorragenden Vergleich mit anderen. Darüber hinaus werden alle Maßnahmen auf Robustheit geprüft. Beachten Sie, dass diese neue Kennzahl auch in der Lage ist, mehr als eine funktionale Beziehung in Daten zu identifizieren und auch nicht funktionale Beziehungen zu identifizieren.


Groß! Ich werde das sehr genau betrachten. Sieht sehr vielversprechend aus ...
Felix S

1
Können Sie bitte den Namen des Artikels angeben? Es scheint verschwunden zu sein!
Creatron

2
Erkennen neuer Assoziationen in großen Datenmengen
Miroslav Sabo

6
Dieser Artikel hat viel Kritik erhalten. Es scheint überzeichnet zu sein. Viele, viele, viele Medien und PR-Arbeiten, aber es scheint schlimm an trivialen Beispielen wie ▄▀ zu scheitern, die es als "linear" erkennt. IIRC ihre Studie war auch nicht gerecht, da sie Reihen für ihre eigene Methode verwendeten; aber im Vergleich zu Pearson statt Spearman Korrelation.
Anony-Mousse


1

Kendalls Tau wird in der Copula-Theorie sehr häufig verwendet, wahrscheinlich, weil es für archimedische Copulas eine sehr natürliche Sache ist, dies in Betracht zu ziehen. Diagramme des kumulativen Kendall-Tau wurden von Genest und Rivest eingeführt, um ein Modell unter Familien bivariater Copulas auszuwählen.

Link zum Artikel von Genest Rivest (1993)


1

Einige robuste Korrelationsmaße sind:

  1. Rangkorrelationskoeffizient nach Spearman

  2. Signum (Blomqvist) Korrelationskoeffizient

  3. Kendalls Tau

  4. Bradleys absoluter Korrelationskoeffizient

  5. Shevlyakov-Korrelationskoeffizient

Verweise:

• Blomqvist, N. (1950) "Über ein Maß der Abhängigkeit zwischen zwei Zufallsvariablen", Annals of Mathematical Statistics, 21 (4): 593-600. Bradley, C. (1985) "The Absolute Correlation", The Mathematical Gazette, 69 (447): 12-17. • Shevlyakov, GL (1997) „Über die robuste Schätzung eines Korrelationskoeffizienten“, Journal of Mathematical Sciences, 83 (3): 434-438. • Spearman, C. (1904) "Der Beweis und die Messung der Assoziation zwischen zwei Dingen", American Journal of Psychology, 15: 88-93.


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.