Wenn zwei Merkmale eine bekannte Korrelation aufweisen, können Sie dann die Wahrscheinlichkeit vorhersagen, dass sie sich für ein zufälliges Paar „ausrichten“?
Es hängt davon ab, welche Populationskorrelation Sie betrachten.
Für die Pearson-Korrelation erwähnen Sie (ρ) lautet die Antwort "nein", zumindest nicht ohne zusätzliche Annahmen. (Die Antwort von RobertF ist richtig)
Wenn Sie stattdessen die Populations- Kendall- Korrelation kennen ( Kendalls Tau , hier bezeichnetτK.) In einer kontinuierlichen bivariaten Verteilung lautet die Antwort dann tatsächlich Ja.
Die Populations-Kendall-Korrelation ist die Differenz zwischen der Wahrscheinlichkeit eines konkordanten Paares und der Wahrscheinlichkeit eines nicht übereinstimmenden Paares:
τK.=pC.- -pD.
(Die Stichproben-Kendall-Korrelation ist in ähnlicher Weise der Unterschied in den Stichprobenanteilen von übereinstimmenden und nicht übereinstimmenden Paaren).
Da in kontinuierlichen bivariaten Populationen pC.+pD.= 1, wenn du weißt τK. Sie können berechnen pC.::
τK.=pC.- -pD.
=pC.- ( 1 -pC.)
= 2pC.- 1
Daher pC.=12(τK.+ 1 ), ein schönes einfaches Ergebnis.
Während τK. bestimmt die Wahrscheinlichkeit, nach der Sie fragen (zumindest im kontinuierlichen Fall), die Beziehung zwischen ρ und τK.hängt von der Struktur der bivariaten Beziehung zwischen den Variablen (dh der Kopula ) ab.
Wenn Sie von einer bivariaten Normalität ausgehen, können Sie die (nichtlineare) Verbindung zwischen herausfinden τK. und ρ. In der Tat ist dies ein bekanntes Ergebnis; wir haben:
τK.=2πarcsin( ρ )
- siehe Abschnitt 5.3.2 von Embrechts et al. (2005) [1], deren Ergebnis auch an verschiedenen Stellen zu finden ist - zum Beispiel in Meyer (2009) [2]. Also in diesem Fall
pC.=arcsin( ρ )π+12.
(Eine Annahme einer bivariaten Normalität erscheint jedoch für den BMI und den Blutdruck zweifelhaft.)
Diese Beziehung zwischen τK. und ρgilt eigentlich für elliptische Verteilungen allgemeiner. Siehe zum Beispiel Lindskog, McNeil & Schmock (2003) [3]. Diese Annahme für BMI und Blutdruck kann jedoch wiederum zweifelhaft sein - beispielsweise sind beide Maßnahmen in der Praxis tendenziell rechtwinklig.
[1] Embrechts, P., Frey, R., McNeil, AJ (2005),
Quantitatives Risikomanagement: Konzepte, Techniken, Werkzeuge ,
Princeton-Reihe in Finance, Princeton University Press
[2] Meyer, C. (2009),
The Bivariate Normal Copula ,
arXiv: 0912.2816v1 [math.PR] pdf (15. Dezember)
[3] Lindskog, F., McNeil, AJ, Schmock, U. (2003),
"Kendalls Tau für elliptische Verteilungen"
in: Kreditrisiko; Messung, Bewertung und Management , hrsg. G. Bol et al.,
Beiträge zur Wirtschaft, Physica-Verlag Heidelberg, S. 149–156.
(oder siehe http://www.macs.hw.ac.uk/~mcneil/ftp/KendallsTau.pdf )