Die explorative Datenanalyse (EDA) führt häufig dazu, dass andere "Spuren" untersucht werden, die nicht unbedingt zum ursprünglichen Satz von Hypothesen gehören. Bei Studien mit einer begrenzten Stichprobengröße und einer Vielzahl von Daten, die über verschiedene Fragebögen gesammelt wurden (soziodemografische Daten, neuropsychologische oder medizinische Maßstäbe - z. B. geistige oder körperliche Funktionen, Depressionen / Angstzustände, Symptomcheckliste), sehe ich mich einer solchen Situation gegenüber ). Es kommt vor, dass EDA dabei hilft, einige unerwartete Beziehungen hervorzuheben ("unerwartet", was bedeutet, dass sie nicht im ursprünglichen Analyseplan enthalten waren), die sich in zusätzlichen Fragen / Hypothesen niederschlagen.
Wie bei einer Überanpassung führt das Ausbaggern oder Aufspüren von Daten zu Ergebnissen, die sich nicht verallgemeinern lassen. Wenn jedoch viele Daten verfügbar sind, ist es für den Forscher oder Arzt ziemlich schwierig, einen begrenzten Satz von Hypothesen zu postulieren.
Ich würde gerne wissen, ob es anerkannte Methoden, Empfehlungen oder Faustregeln gibt, die bei kleinen Stichproben zur Abgrenzung der EDA beitragen können.