Was für eine Verteilung ist das?


8

Ich sah mich einer begrenzenden Verteilung mit einer Kovarianz von Null zwischen zwei Variablen gegenüber, aber ihre Korrelation ist . Gibt es eine solche Verteilung? Wie kann es erklärt werden?1


Sie haben Recht, vielleicht muss ich mehr Details geben. OK, X und Y sind bivariate Normalverteilungen mit unterschiedlichen Varianzen und Mitteln (frei von n), aber corr = 1- (1 / n). Untersuchen Sie nun die Grenzverteilung von Yn | Xn = x.


23
Diese Verteilung wird als Rechenfehler bezeichnet .
Hat aufgehört - Anony-Mousse

5
Bitte geben Sie die Details an, um die offensichtliche Diskrepanz zu beheben. Was sind die Umstände?
Glen_b -State Monica

Bitte geben Sie noch mehr Details zur gemeinsamen Verteilung von Xn und Yn . Was führt insbesondere zu ρn=11/n ?
Mico

Mehr Details habe ich leider nicht. Ihre Frage ist eine Frage, über die ich auch nachgedacht habe. Wie hängt ρn von n ab, wenn die Varianzen frei von n sind? und was bedeutet das genau?
Behgol

Warum denkst du, ist die Kovarianz 0 ?
Juho Kokkala

Antworten:


5

Nach einer Klarstellung durch das OP scheint es, dass a) wir annehmen, dass die beiden Variablen gemeinsam einer bivariaten Normalen folgen und b) unser Interesse an der bedingten Verteilung liegt, die dann ist

YnXn=x  N(μy+σyσxρn(xμx),(1ρn2)σy2)

Dann sehen wir , dass als , haben wir ρ n1 , und die Varianz der bedingten Verteilung auf Null geht. Wenn die Korrelation zur Einheit geht, reicht es intuitiv aus, " x zu kennen ", um auch " y zu kennen ".nρn1xy

Aber nirgends oben bekommen wir, dass Null ist. Auch an der Grenze bleibt die Kovarianz gleich Cov ( Y n , X n ) σ y σ x . Cov(Yn,Xn)Cov(Yn,Xn)σyσx

Beachten Sie, dass die bedingte Kovarianz (und dann auch die bedingte Korrelation) immer Null ist, weil,

Cov(Yn,XnXn=x)=E(YnXnXn=x)E(YXn=x)E(XXn=x)

=xE(YnXn=x)xE(YXn=x)=0

Xn=x


Danke für deine Antwort. Es ist also eine Normalverteilung ohne Varianz? Wie wäre seine Form?
Behgol


20

XY[1,1]

X=Yσx2Xlim σ 2 x0 cor ( X , Y ) = 1limσx20cov(X,Y)=0limσx20cor(X,Y)=1

Anmerkung 1: Wenn die Korrelation streng undefiniert, da ihr Nenner gleich 0 wäre.σx2=0


Sie haben Recht, vielleicht sollte ich mehr Details geben. OK X und Y sind eine bivariante Normalverteilung mit unterschiedlicher Varianz und Mittelwert (frei von n), aber corr = 1- (1 / n). Untersuchen Sie nun die Grenzverteilung von Yn | Xn = x.
Behgol

Der Wortlaut "Da die Kovarianz von der Skala abhängt" impliziert, dass dies in der Frage angegeben ist. Dies scheint jedoch mehr zu sein, als die Frage impliziert. Es scheint mir, dass Sie postulieren, dass dies so sein könnte, mit erklärten Schlussfolgerungen. Korrigieren Sie mich, wenn das falsch ist.
Nick Cox

18

Soweit ich sehen kann (vielleicht außerhalb einiger besonderer Umstände, aber Sie erwähnen keine), ist dies nicht möglich.

Die Korrelation ist die Kovarianz geteilt durch das Produkt der beiden Standardabweichungen. Wenn die Kovarianz also Null ist, ist die Korrelation entweder Null (wenn beide Standardabweichungen nicht Null sind) oder undefiniert (wenn mindestens eine Standardabweichung 0 ist). Es sollte nicht 1 sein, wenn die Kovarianz 0 ist.

Ich gehe davon aus, dass Sie entweder einen Fehler in Ihrer Analyse gemacht haben oder Ihre Beschreibung nicht klar genug ist, um die Situation richtig zu erkennen.


1

Sie haben wahrscheinlich Schwierigkeiten, weil Sie die Daten als Gauß'sch visualisieren.

Es ist möglich, dass alle Daten denselben Punkt darstellen (obwohl dies redundant wäre) und dass Sie zwei Variablen mit unterschiedlichen Namen (Aliase voneinander) haben, aus denen die Daten bestehen. Dies würde zu einer Kovarianz von Null führen, und eine Korrelation von 1, da die Kovarianz im Grunde genommen die Verteilung der Daten über den Merkmalsraum darstellt, während die Korrelation angibt, wie stark eine Variable von einer anderen abhängt oder wie stark sie sich gegenseitig beeinflusst. Wenn die Daten überhaupt nicht verteilt sind, muss die Kovarianz Null sein.

HINWEIS Das Beste, was Sie mit einem solchen Datensatz tun können, ist jedoch, einfach vorherzusagen, dass alle Punkte dieselbe Ausgabe haben, was höchstwahrscheinlich zu einer hohen Verzerrung führen wird


2
In dieser Antwort scheinen einige verschiedene Dinge vor sich zu gehen, und es fällt mir schwer, die Beziehung zu erkennen. Wie ist beispielsweise Absatz 1 relevant? Wie ist Absatz 3 relevant? Wie kommen Sie in Absatz 2 zu einer Kovarianz von Null?
Richard Hardy

Vielen Dank an Richard Hardy für den Hinweis. Eine der anderen Antworten schlug zunächst eine Gaußsche Lösung vor. Deshalb Abs. 1. In Abs. 3 gebe ich nur meine Meinung dazu ab, was er mit einem solchen Datensatz machen kann. Grundsätzlich gibt die Kovarianz an, wie verteilt die Daten über den Feature-Space sind. Wenn die Daten nicht auf verteilt sind, muss die Kovarianz Null sein. Ich habe dies auch zur Antwort hinzugefügt
RS Nikhil Krishna
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.