Ich recherchiere über Lernspiele und einige meiner aktuellen Projekte beinhalten die Verwendung von Daten aus BoardGameGeek (BGG) und VideoGameGeek (VGG), um die Beziehungen zwischen Designelementen von Spielen zu untersuchen (dh "im Zweiten Weltkrieg spielen", "Würfeln"). ) und Spielerbewertungen dieser Spiele (dh Punktzahlen von 10). Jedes dieser Designelemente entspricht einem Tag im BGG- oder VGG-System, sodass jedes Element im Wesentlichen eine dichotome Variable ist. Ein Spiel hat eine 1 für jedes Tag, das in der Datenbank vorhanden ist, und eine 0 für jedes Tag, das nicht vorhanden ist.
Es gibt Dutzende dieser Tags, daher möchte ich die explorative Faktoranalyse (EFA) verwenden, um eine überschaubare Anzahl von "Genres" zu entwickeln, die Muster im Spieldesign erfassen. Wenn ich mehrere Quellen konsultiere, verstehe ich, dass ich, da ich mit dichotomen Variablen arbeite , polychrone Korrelationen ( insbesondere hier tetrachorisch ) anstelle von Pearson- Korrelationen verwenden sollte , wenn ich meine Faktoren erarbeite (es gibt auch andere Optionen - wie die Analyse latenter Merkmale - da draußen, aber das ist das, was ich gerade erforsche).
Aus Neugier habe ich zwei Sätze von Faktoren entwickelt, einen mit Pearson-Korrelationen und einen mit polychromen Korrelationen (jedes Mal die gleiche Anzahl von Faktoren). Mein Problem ist, dass die mit Pearson-Korrelationen berechneten Faktoren viel sinnvoller und leichter zu interpretieren sind als die mit polychromen Korrelationen berechneten Faktoren. Mit anderen Worten, die "Genres" aus der ersten Reihe von Faktoren sind intuitiv sinnvoll und entsprechen meinem Verständnis, wie Spiele normalerweise gestaltet sind. Dies ist bei der zweiten Reihe von Faktoren nicht der Fall.
Einerseits möchte ich sicherstellen, dass ich die Annahmen der von mir verwendeten Tests erfülle, auch wenn dies meine Ergebnisse weniger hübsch macht. Auf der anderen Seite denke ich, dass ein Teil des Ziels der Faktoranalyse und (allgemeineren) Modellbildung darin besteht, etwas Nützliches zu finden, und die nützlicheren Informationen entstehen, wenn ich "gegen die Regeln verstoße". Reicht die Notwendigkeit eines nützlichen Modells aus, um die Annahmen dieses Tests zu überwiegen? Was genau sind die Konsequenzen der Verwendung von Pearson-Korrelationen anstelle von polychromen?