In einem Datensatz von zwei nicht überlappenden Populationen (Patienten & Gesunde, insgesamt ) möchte ich (aus unabhängigen Variablen) signifikante Prädiktoren für eine kontinuierliche abhängige Variable finden. Korrelation zwischen Prädiktoren ist vorhanden. Ich bin daran interessiert herauszufinden, ob einer der Prädiktoren "in der Realität" mit der abhängigen Variablen zusammenhängt (anstatt die abhängige Variable so genau wie möglich vorherzusagen). Da ich mit den zahlreichen möglichen Ansätzen überfordert war, möchte ich fragen, welcher Ansatz am besten zu empfehlen ist.300
Nach meinem Verständnis wird das schrittweise Einschließen oder Ausschließen von Prädiktoren nicht empfohlen
Führen Sie z. B. eine lineare Regression für jeden Prädiktor separat durch und korrigieren Sie die p-Werte für den Mehrfachvergleich mit FDR (wahrscheinlich sehr konservativ?)
Prinzipal-Komponenten-Regression: Schwierig zu interpretieren, da ich nicht über die Vorhersagekraft einzelner Prädiktoren, sondern nur über die Komponenten berichten kann.
Irgendwelche anderen Vorschläge?