Ich denke, Jeromys Antwort ist ausreichend, wenn Sie zwei experimentelle Studien oder eine tatsächliche Metaanalyse untersuchen. Oft stehen wir jedoch vor der Prüfung zweier nicht experimenteller Studien und haben die Aufgabe, die Gültigkeit dieser beiden unterschiedlichen Ergebnisse zu bewerten.
Wie Cyrus 'Einkaufsliste mit Fragen nahe legt, kann das Thema selbst nicht kurz beantwortet werden , und ganze Bücher zielen im Wesentlichen darauf ab, eine solche Frage zu beantworten. Für alle, die an der Erforschung nicht experimenteller Daten interessiert sind, würde ich Ihnen dringend empfehlen, diese zu lesen
Experimentelle und quasi-experimentelle Entwürfe für verallgemeinerte kausale Folgerungen von William R. Shadish, Thomas D. Cook und Donald Thomas Campbell (auch ich habe gehört, dass die älteren Versionen dieses Textes genauso gut sind).
Mehrere Punkte, auf die sich Jeromy bezog (größere Stichproben und größere methodische Genauigkeit), und alles, was Cyrus erwähnt, würde als das angesehen, was Campbell und Cook als "interne Gültigkeit" bezeichnen. Dazu gehören Aspekte des Forschungsdesigns und der statistischen Methoden zur Bewertung der Beziehung zwischen X und Y. Insbesondere als Kritiker sind wir besorgt über Aspekte, die die Ergebnisse verzerren und die Zuverlässigkeit der Ergebnisse beeinträchtigen könnten. Da dies ein Forum ist, das sich der statistischen Analyse widmet, konzentrieren sich viele der Antworten auf statistische Methoden, um unvoreingenommene Schätzungen der von Ihnen bewerteten Beziehung sicherzustellen. Es gibt jedoch auch andere Aspekte des Forschungsdesigns, die nichts mit der statistischen Analyse zu tun haben und die die Gültigkeit der Ergebnisse beeinträchtigen, unabhängig davon, wie streng die statistische Analyse ist (wie Cyrus 'Erwähnung mehrerer Aspekte der Versuchstreue angesprochen, aber nicht gelöst werden kann) statistische Methoden und deren Auftreten beeinträchtigen immer die Gültigkeit der Studienergebnisse. Es gibt viele andere Aspekte der internen Validität, die für den Vergleich der Ergebnisse nicht experimenteller Studien, die hier nicht erwähnt werden, von entscheidender Bedeutung sind, sowie Aspekte von Forschungsdesigns, die die Zuverlässigkeit der Ergebnisse unterscheiden können. Ich halte es nicht für angebracht, hier zu sehr ins Detail zu gehen.
Campbell und Cook verweisen auch auf die "externe Validität" von Studien. Dieser Aspekt des Forschungsdesigns ist oft viel kleiner und verdient nicht so viel Aufmerksamkeit wie die interne Validität. Die externe Validität befasst sich im Wesentlichen mit der Generalisierbarkeit der Ergebnisse, und ich würde sagen, dass Laien die externe Validität oft angemessen beurteilen können, solange sie mit dem Thema vertraut sind. Lange Rede, kurzer Sinn, lesen Sie das Buch von Shadish, Cook und Campbell.