Gibt es eine Beziehung zwischen Cosinus-Ähnlichkeit, Pearson-Korrelation und Z-Score?


16

Ich frage mich, ob es einen Zusammenhang zwischen diesen drei Maßnahmen gibt. Ich kann nicht scheinen, eine Verbindung zwischen ihnen herzustellen, indem ich mich auf die Definitionen beziehe (möglicherweise, weil ich mit diesen Definitionen neu bin und es ein bisschen schwer habe, sie zu erfassen).

Ich weiß, dass der Bereich der Cosinus-Ähnlichkeit zwischen 0 und 1 liegen kann und dass die Pearson-Korrelation zwischen -1 und 1 liegen kann, und ich bin mir nicht sicher, welchen Bereich der z-Score hat.

Ich weiß jedoch nicht, wie ein bestimmter Wert der Cosinus-Ähnlichkeit etwas über die Pearson-Korrelation oder den Z-Score aussagen könnte und umgekehrt?


1
z Punktzahl von was ? z-Werte von einigen Dingen können mit der Pearson-Korrelation zusammenhängen, Z-Werte von anderen Dingen möglicherweise nicht. Wenn Sie beispielsweise Ihre ursprünglichen Variablen intern standardisieren, ist die Pearson-Korrelation zwischen x und y das erwartete Produkt ihrer Z-Scores. Oder Sie sprechen über z-Scores von Pearson-Korrelationen (Pearson-Korrelationen abzüglich ihrer Erwartung unter bestimmten Bedingungen geteilt durch den Standardfehler der Pearson-Korrelation), die sicherlich mit der Pearson-Korrelation zusammenhängen würden.
Glen_b

Antworten:


28

Die Cosinusähnlichkeit zwischen zwei Vektoren und b ist nur der Winkel zwischen ihnen cos θ = a bab In vielen Anwendungen, die Kosinusähnlichkeit verwenden, sind die Vektoren nicht negativ (z. B. ein Termfrequenzvektor für ein Dokument), und in diesem Fall ist die Kosinusähnlichkeit auch nicht negativ.

cosθ=abab

Für einen Vektor der " z- Punkt" -Vektor typischerweise definiert als z = x - ˉ xxz mit ˉ x =1

z=xx¯sx
unds 2 x = ¯ ( x - ˉ x ) 2 sind der Mittelwert undStandardabweichung vonx. Also hatzden Mittelwert 0 und die Standardabweichung 1, dhzxist diestandardisierteVersion vonx.x¯=1nixisx2=(xx¯)2¯xzzxx

Für zwei Vektoren und y , dessen Korrelationskoeffizient wäre ρ x , y = ¯ ( z x Z y )xy

ρx,y=(zxzy)¯

Wenn der Vektor Mittelwert Null hat, ist seine Varianz s 2 a = 1a, so dass ihr Einheitsvektor und z-Score wird durchBeziehungwerden a =asa2=1na2

a^=aa=zan

Also wenn die Vektoren ab

TL; DR Cosinus-Ähnlichkeit ist ein Skalarprodukt von Einheitsvektoren. Die Pearson-Korrelation ist die Kosinusähnlichkeit zwischen zentrierten Vektoren. Die "Z-Score-Transformation" eines Vektors ist der auf eine Norm von skalierte zentrierte Vektorn .


+1. latexnazi comment: \| often looks better than ||, and \lVert ... \rVert is the best way to write it.
amoeba says Reinstate Monica
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.