Intuition hinter den Namen 'partielle' und 'marginale' Korrelationen


12

Hat jemand eine Vorstellung davon, warum die bedingte Korrelation zwischen zwei Variablen als "partielle" Korrelation und die einfache Korrelation zwischen ihnen (wenn sie also nicht von einer anderen Variablen abhängig ist) als "marginale" Korrelation bezeichnet wird? Was ist die Intuition hinter den Wörtern "partiell" und "marginal"? Was machen sie mit "Teilen" oder "Rändern"?

Es wäre gut, die Antwort zu lernen, um diese Konzepte besser zu verstehen.


Antworten:


11

Der Begriff "marginal" ist sehr alt. Wenn Sie in der Geschichte weit genug zurückgehen, gab es keine wissenschaftlichen Zeitschriften (offensichtlich begannen sie um 1665 ). Stattdessen wurden Zwischenergebnisse über handgeschriebene Briefe kommuniziert und die Endergebnisse in Büchern festgehalten. Vor Playfair gab es nicht viel an Datengrafiken , aber Bücher hatten oft Tabellen mit Zahlen unter verschiedenen Bedingungen. Betrachten Sie diese Tabelle:
Diese Werte sind allebedingt; Das heißt, sie geben eine Nummer für eine bestimmte Kombination von Bedingungen an. Manchmal wollten die Leser jedoch wissen, wie eine bestimmte Bedingung ohne Berücksichtigung der anderen Variablen aussieht. Stellen Sie sichxI,Avor, wie oft etwas passiert ist, als die erste VariableI war

ABCDIxI,AxI,BxI,CxI,DIIxII,AxII,BxII,CxII,DIIIxIII,AxIII,BxIII,CxIII,DIVxIV,AxIV,BxIV,CxIV,D
xI,AIund die zweite Variable war . Dann könnte jemand wissen wollen, wie oft dies passiert ist, als die erste Variable ich war, egal was die zweite Variable war? Es ist einfach, das herauszufinden. Sie fassen einfach die x s in der ersten Zeile zusammen und ignorieren die Spalten. Die Leute machten so etwas gewöhnlich und schrieben (natürlich) die Zahlen am Rand des Buches neben dem Tisch. Während die ursprünglichen Nummern an Bedingungen geknüpft sind, gab es für diese anderen Arten von Nummern keinen Namen. Sie wurden als " marginal " bekannt. AIx

Was haben diese Zahlen mit Korrelationen zu tun? Nun, es ist keine direkte Verbindung, aber wenn Sie einmal die Idee haben, andere Variablen nicht zu berücksichtigen, und Sie einen Namen dafür haben ("marginal"), wenn ein neuer Kontext entsteht, der analog ist (dh Korrelationen) , der Name und die Idee werden einfach angewendet.


Ich kenne die Etymologie partieller Korrelationen nicht, aber ich kann Ihnen die Intuition geben. Eigentlich ist es ziemlich einfach: Sie haben es mit der Korrelation zwischen einem Teil einer Variablen und einem Teil einer anderen zu tun. Betrachten Sie diese Abbildung:

enter image description here

Wir können der linke Kreis vorstellen , ist eine Variable , der rechte Kreis ist eine Variable Y , und der obere Kreis ist eine Variable Z . Die Korrelation zwischen zwei Variablen hängt davon ab, wie stark sich die Kreise überlappen (tatsächlich können wir uns vorstellen, dass die Fläche der Kreise die Variabilität jeder Variablen darstellt und dass der Prozentsatz der Fläche r 2 beträgt ). Nun ist es klar , dass es eine Korrelation zwischen dem , X und Y , aber es gibt auch eine gewisse Korrelation zwischen X und Z , und zwischen Y und Z . Was wäre, wenn Sie wissen wollten, wie die Korrelation zwischen diesen Teilen von war ?XYZr2XYXZYZ und Y , die nichts mit Z zu tun hattenXYZ ? Das wäre dieteilweise Korrelation. Dies hängt mit der Überlappung zwischen den beidenTeilender Kreise zusammen, die nicht die oberen Splitter enthalten, die sich mit dem oberen Kreis schneiden.

Ich mag diese Webseite sehr, weil sie eine leicht verständliche Diskussion über Teilkorrelationen und verwandte Themen bietet. Nur im ersten Abschnitt geht es um Teilkorrelationen an sich, aber ich empfehle dringend, die ganze Seite zu lesen (obwohl sie ziemlich lang ist). Obwohl nicht direkt verwandt, die Diskussion in diesem Thread: Wo ist die gemeinsame Varianz zwischen allen IVs in einer linearen multiplen Regressionsgleichung? kann auch hilfreich sein.


1
ρ(X,Y)=ρ(Y,X)ρXY|Z=ρYX|Z? Using the formula above, we could write: ρYX|Z=Area(1)Area(X(2+center)), and I don't think that ρXY|Z will always be equal to ρYX|Z because the denominators can change (is the size of the circles representing X and Y based on the measure of the set X and the measure of the set Y ?)?
Kiran K.

1
That should probably be a new question, @KiranK. It's a good question & we don't want it buried in comments where people won't ever find it.
gung - Reinstate Monica

Good idea, I reposted as a question here: stats.stackexchange.com/questions/195410/…
Kiran K.

0

The correlation ρXY between 2 variables X,Y (which you call marginal correlation) indicates that both variables samples show some dependence.

The partial correlation ρXYZ measures the residual correlation between X,Y once the influence of the confounding variable Z has been removed by linear regression.

In mathematical terms, this is expressed as:

ρXYZ:=ρXYρXZρYZ1ρXZ21ρYZ2

To illustrate the properties coming from this definition, we can consider two limit cases:

  • if X and Y are both 0% correlated with the variable Z, then the partial correlation is the correlation:

    ρXYZ=ρXY

  • If Y is 100% correlated with Z however, then the partial correlation is always 0 no matter the value of ρXY.

ρXYZ=0

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.