Ich suche nach Korrelationen zwischen den Antworten auf verschiedene Fragen in einer Umfrage ("ähm, mal sehen, ob die Antworten auf Frage 11 mit denen von Frage 78 korrelieren"). Alle Antworten sind kategorisch (die meisten reichen von "sehr unglücklich" bis "sehr glücklich"), aber einige haben unterschiedliche Antworten. Die meisten von ihnen können als ordinal betrachtet werden. Betrachten wir diesen Fall hier.
Da ich keinen Zugang zu einem kommerziellen Statistikprogramm habe, muss ich R verwenden.
Ich habe Rattle ausprobiert (ein Freeware-Data-Mining-Paket für R, sehr geschickt), aber leider werden keine kategorialen Daten unterstützt. Ein Hack, den ich verwenden könnte, besteht darin, die codierte Version der Umfrage, die Zahlen (1..5) anstelle von "sehr unglücklich" ... "glücklich" enthält, in R zu importieren und Rattle glauben zu lassen, dass es sich um numerische Daten handelt.
Ich dachte daran, ein Streudiagramm zu erstellen und die Punktgröße proportional zur Anzahl der Zahlen für jedes Paar zu haben. Nach einigem googeln fand ich http://www.r-statistics.com/2010/04/correlation-scatter-plot-matrix-for-ordered-categorical-data/, aber es scheint (für mich) sehr kompliziert zu sein.
Ich bin kein Statistiker (sondern ein Programmierer), habe aber etwas darüber gelesen, und wenn ich das richtig verstehe, wäre Spearmans Rho hier angemessen.
Also die Kurzfassung der Frage für diejenigen, die es eilig haben: Gibt es eine Möglichkeit, Spearmans Rho schnell in R zu zeichnen ? Ein Plot ist einer Zahlenmatrix vorzuziehen, da es einfacher ist, einen Ball zu sehen, und auch in Materialien enthalten sein kann.
Danke im Voraus.
PS Ich habe eine Weile darüber nachgedacht, ob ich das auf der SO-Hauptseite oder hier posten soll. Nachdem ich beide Sites nach R-Korrelation durchsucht hatte, fand ich, dass diese Site für die Frage besser geeignet ist.