Ich habe einen Datensatz von 45 Teilnehmern mit jeweils 96 Variablen (obwohl einige Messungen fehlen). Einige Variablen sind einfach, wie z. B. Alter und Behinderung, während andere Messungen bei einem bestimmten Test bewertet werden (z. B. hat ein Test 5 Werte als Ergebnis). Ich habe Daten von 5 Tests, die zu 3 verschiedenen Zeitpunkten angegeben wurden und wie bereits erwähnt, manchmal mehrere Ergebnisse pro Test.
Da der Datensatz so groß ist (angesichts der Anzahl der Funktionen und der Anzahl der Teilnehmer), habe ich beschlossen, die Ergebnisse eines Tests anhand aller vorherigen Ergebnisse (wie Alter, Behinderung und aller Ergebnisse desselben vorherigen Tests) vorherzusagen. Das läuft also im Wesentlichen darauf hinaus, dass ich 5 Merkmale bei ungefähr 10 Merkmalen bei 45 Teilnehmern mithilfe der Regression vorhersagen möchte (ich möchte die genauen Koeffizienten, p-Werte und R-Quadrat-Messungen anzeigen).
Sollte ich eine regelmäßige Regression für jedes der Features durchführen, die ich vorhersagen möchte, oder sollte ich eine multivariate Regression für alle Features verwenden, die ich gleichzeitig vorhersagen möchte? Was ist der Unterschied?