Im sozialwissenschaftlichen Kontext, aus dem ich komme, geht es darum, ob Sie an (a) Vorhersage oder (b) Prüfung einer gezielten Forschungsfrage interessiert sind. Wenn der Zweck die Vorhersage ist, sind datengetriebene Ansätze angemessen. Wenn der Zweck darin besteht, eine gezielte Forschungsfrage zu untersuchen, ist es wichtig zu prüfen, welches Regressionsmodell Ihre Frage speziell testet.
Wenn Ihre Aufgabe beispielsweise darin bestand, eine Reihe von Auswahltests auszuwählen, um die Arbeitsleistung vorherzusagen, kann das Ziel in gewisser Weise darin gesehen werden, die Vorhersage der Arbeitsleistung zu maximieren. Daher wären datengetriebene Ansätze nützlich.
Wenn Sie dagegen die relative Rolle von Persönlichkeitsvariablen und Fähigkeitsvariablen bei der Beeinflussung der Leistung verstehen möchten, ist ein spezifischer Modellvergleich möglicherweise besser geeignet.
Bei der Erforschung fokussierter Forschungsfragen geht es in der Regel darum, etwas über die zugrunde liegenden kausalen Prozesse herauszufinden, die ablaufen, anstatt ein Modell mit optimaler Vorhersage zu entwickeln.
Wenn ich dabei bin, Modelle für Prozesse zu entwickeln, die auf Querschnittsdaten basieren, muss ich Folgendes beachten: (a) Einbeziehen von Prädiktoren, die theoretisch als Konsequenzen der Ergebnisvariablen angesehen werden könnten. Zum Beispiel ist die Überzeugung einer Person, dass sie eine gute Leistung erbringt, ein guter Indikator für die Arbeitsleistung, aber es ist wahrscheinlich, dass dies zumindest teilweise auf die Tatsache zurückzuführen ist, dass sie ihre eigene Leistung beobachtet hat. (b) Einbeziehung einer großen Anzahl von Prädiktoren, die alle dieselben zugrunde liegenden Phänomene widerspiegeln. ZB einschließlich 20 Einzelteilen, die alle Zufriedenheit mit dem Leben auf verschiedene Arten messen.
Daher hängen fokussierte Forschungsfragen viel mehr von domänenspezifischem Wissen ab. Dies erklärt wahrscheinlich, warum datengetriebene Ansätze in den Sozialwissenschaften weniger häufig verwendet werden.