Die Anforderungen dieser Art von Fragen kommen mir etwas bizarr vor. Hier ist eine mathematische Begriff / Formel, über die ich jedoch in einem Kontext sprechen möchte, in dem mathematische Symbole völlig fehlen. Ich denke auch, es sollte festgestellt werden, dass die eigentliche Algebra, die zum Verstehen der Formeln notwendig ist, den meisten Menschen vor der Hochschulbildung beigebracht werden sollte (ein Verständnis der Matrixalgebra ist nicht erforderlich, nur eine einfache Algebra wird ausreichen).
Schauen wir uns also zunächst die Formel an und versuchen Sie, die einzelnen Komponenten in kleinen Schritten zu erklären, anstatt die Formel vollständig zu ignorieren und in einigen magischen und heuristischen Analogietypen darüber zu sprechen. Der Unterschied in Bezug auf Kovarianz und Korrelation sollte bei Betrachtung der Formeln deutlich werden. In Analogien und Heuristiken zu sprechen, würde meines Erachtens zwei relativ einfache Konzepte und deren Unterschiede in vielen Situationen verschleiern.
Beginnen wir also mit einer Formel für die Sample-Kovarianz (diese habe ich gerade genommen und aus Wikipedia übernommen);
1n - 1∑ni = 1( xich- x¯) ( yich- y¯)
Definieren Sie explizit alle Elemente und Operationen in der Formel, um alle Benutzer auf den neuesten Stand zu bringen.
- und y i sind jeweils Messungen von zwei seperate Attributen der gleichen BeobachtungXichyich
- und ˉ y sind die Mittelwerte (oder Mittelwerte) der einzelnen AttributeX¯y¯
- Für , sagen wir einfach, wir teilen das Endergebnis durchn-1.1n - 1n - 1
- kann für manche ein fremdes Symbol sein, daher wäre es wahrscheinlich nützlich, diese Operation zu erklären. Es ist einfach die Summe aller i Beobachtungen trennen, und n die Gesamtzahl der Beobachtungen.∑ni = 1ichn
An dieser Stelle möchte ich ein einfaches Beispiel vorstellen, um den Elementen und Operationen sozusagen ein Gesicht zu geben. Stellen wir uns zum Beispiel eine Tabelle zusammen, in der jede Zeile einer Beobachtung entspricht (und und y entsprechend beschriftet sind). Man würde diese Beispiele wahrscheinlich spezifischer machen (z. B. x steht für Alter und y für Gewicht), aber für unsere Diskussion hier sollte es keine Rolle spielen.XyXy
x y
---
2 5
4 8
9 3
5 6
0 8
Wenn Sie der Meinung sind, dass die Summenoperation in der Formel möglicherweise nicht vollständig verstanden wurde, können Sie sie an dieser Stelle in einem viel einfacheren Kontext erneut einführen. Sagen Sie einfach, dass dasselbe ist wie in diesem Beispiel;∑ni = 1( xich)
x
--
2
4
9
5
+ 0
--
20
( xich- x¯) ( yich- y¯)X¯y¯( xich- x¯)X
x x_bar (x - x_bar)
2 4 -2
4 4 0
9 4 5
5 4 1
0 4 -4
y
y y_bar (y - y_bar)
5 6 -1
8 6 2
3 6 -3
6 6 0
8 6 2
( xich- x¯)( yich- y¯)( xich- x¯) ⋅ ( yich- y¯)
Beachten Sie, was beim Multiplizieren passiert. Wenn zwei Beobachtungen beide einen großen Abstand über dem Mittelwert haben, hat die resultierende Beobachtung einen noch größeren positiven Wert (das gleiche gilt, wenn beide Beobachtungen einen großen Abstand unter dem Mittelwert haben, wenn zwei Negative multipliziert werden) gleich ein positives). Beachten Sie auch, dass, wenn eine Beobachtung hoch über dem Mittelwert liegt und die andere deutlich unter dem Mittelwert liegt, der resultierende Wert groß (in absoluten Zahlen) und negativ ist (als positives Mal entspricht ein negatives einer negativen Zahl). Schließlich ist zu beachten, dass die Multiplikation der beiden Werte zu einer kleinen Zahl führt, wenn ein Wert sehr nahe am Mittelwert für eine der beiden Beobachtungen liegt. Auch hier können wir diese Operation nur in einer Tabelle darstellen.
(x - x_bar) (y - y_bar) (x - x_bar)*(y - y_bar)
-2 -1 2
0 2 0
5 -3 -15
1 0 0
-4 2 -8
n - 1
(x - x_bar)*(y - y_bar)
-----------------------
2
0
-15
0
+ -8
-----
-21
-21/(5-1) = -5.25
An diesem Punkt möchten Sie möglicherweise die Herkunft der 5 verdeutlichen. Dies sollte jedoch so einfach sein, dass Sie auf die Tabelle zurückgreifen und die Anzahl der Beobachtungen zählen (lassen Sie den Unterschied zwischen Stichprobe und Population zu einem anderen Zeitpunkt).
ρ
ρ = Co v ( x , y)Va r ( x ) Va r ( y)√
Co v ( x , x ) = Vein r ( x )). Und es gelten dieselben Konzepte, die Sie mit der Kovarianz eingeführt haben (dh, wenn eine Reihe viele Werte hat, die weit vom Mittelwert entfernt sind, hat sie eine hohe Varianz). Beachten Sie hier vielleicht, dass eine Reihe auch keine negative Varianz haben kann (was logischerweise aus der zuvor vorgestellten Mathematik folgen sollte).
Va r ( x ) Va r ( y)Va r ( x ) Va r ( y)-----------√
Ich verstehe unter Umständen, dass diese Behandlungsstufe nicht angemessen wäre. Der Senat benötigt die Zusammenfassung . In diesem Fall können Sie auf die einfachen Heuristiken zurückgreifen, die in anderen Beispielen verwendet wurden, aber Rom wurde nicht an einem Tag erbaut. Und an den Senat, der um die Zusammenfassung bittet: Wenn Sie so wenig Zeit haben, sollten Sie vielleicht einfach mein Wort dafür nehmen und auf die Formalitäten der Analogien und Stichpunkte verzichten.