Diese Begriffe erscheinen in einigen Büchern über multivariate Statistiken. Angenommen, Sie haben n
Personen nach p
quantitativer Merkmalsdatenmatrix. Dann können Sie Personen als Punkte in dem Raum zeichnen, in dem die Achsen die Merkmale sind. Das wird ein klassisches Streudiagramm sein, auch bekannt als variables Raumdiagramm. Wir sagen, die Wolke von Individuen überspannt den Raum , der durch die Achsenmerkmale definiert ist.
Sie können sich das Streudiagramm auch so vorstellen, dass Punkte die Variablen und die Achsen die Individuen sind. Absolut wie vorher, nur auf den Kopf gestellt. Das wird Thema Raum Grundstück (oder Beobachtungsraum Grundstück) mit den Variablen Spanning es, die Individuen zu definieren es.
Beachten Sie, dass, wenn (wie so oft) n>p
im zweiten Fall nur einige p
Dimensionen außerhalb der n
Dimensionen nicht redundant sind; Das bedeutet, dass Sie die p
variablen Punkte auf dem p
eindimensionalen Diagramm zeichnen können und können . Traditionell sind variable Punkte normalerweise mit dem Ursprung verbunden und erscheinen daher als Vektoren (Pfeile). Wir verwenden die Darstellung des Subjektraums hauptsächlich, um Beziehungen zwischen Variablen darzustellen. Daher lassen wir die Achsen-Subjekte fallen und stellen der Einfachheit halber Punkte als Pfeile dar.1
Wenn Merkmale (Spalten der Datenmatrix) vor dem Zeichnen des Objektraumdiagramms zentriert wurden, entsprechen die Kosinusse der Winkel zwischen den variablen Vektoren ihren Pearson-Korrelationen, während die Vektorlängen den Normen der Variablen (Wurzelsumme der Quadrate) entsprechen ) oder Standardabweichungen (wenn durch df geteilt ).
Variabler Raum und Subjektraum sind zwei Seiten derselben Medaille, sie sind der gleiche euklidische analytische Raum, der nur spiegelbildlich zueinander dargestellt wird. Sie haben dieselben Eigenschaften wie die Eigenwerte ungleich Null und die Eigenvektoren. Es ist daher möglich, sowohl Subjekte als auch Variablen nebeneinander als Punkte im Raum der Hauptachsen (oder einer anderen orthogonalen Basis) dieses analytischen Raums darzustellen . Diese gemeinsame Darstellung wird als Biplot bezeichnet . Ich weiß nicht genau, was der Begriff "Datenraum" bedeutet - wenn er etwas Bestimmtes bedeutet, dann ist es vermutlich der gemeinsame analytische Raum, dessen Subjektraum und variabler Raum die beiden Hypostasen sind.
Einige lokale Links:
1 Stellen Sie sich vor, Sie haben n=5
Individuen und p=2
Variablen und haben es irgendwie magisch geschafft, die 2 Punkte im 5-dimensionalen Raum zu zeichnen. Dann können Sie den durch 2 beliebige Achsen definierten Unterraum so drehen, dass die 2 Punkte (die sich von nun an über diese Ebene erstrecken) eingebettet sind. Danach lassen Sie die anderen 3 Achsen (Abmessungen) sicher fallen, da sie unnötig geworden sind. Die Position der beiden variablen Punkte relativ zueinander wurde beibehalten.