Dies ist eine Diskussionsfrage zum Schnittpunkt von Statistik und anderen Wissenschaften. Ich stehe oft vor dem gleichen Problem: Forscher auf meinem Gebiet neigen dazu zu sagen, dass es keinen Effekt gibt, wenn der p-Wert nicht unter dem Signifikanzniveau liegt. Anfangs habe ich oft geantwortet, dass dies nicht die Funktionsweise von Hypothesentests ist. Angesichts der Häufigkeit dieser Frage möchte ich dieses Thema mit erfahrenen Statistikern diskutieren.
Betrachten wir einen kürzlich erschienenen Artikel in einer wissenschaftlichen Zeitschrift der „Best Publishing Group“ Nature Communications Biology (es gibt mehrere Beispiele, aber konzentrieren wir uns auf eines).
Forscher interpretieren ein nicht statistisch signifikantes Ergebnis folgendermaßen:
Eine chronische Einschränkung der Kalorienzufuhr kann somit die Lebensdauer verlängern und die Gesundheit eines Primaten verbessern, beeinträchtigt jedoch die Integrität der grauen Hirnsubstanz, ohne die kognitiven Leistungen zu beeinträchtigen .
Beweis:
Die Leistungen in der Barnes-Labyrinthaufgabe unterschieden sich jedoch nicht zwischen Kontroll- und kalorienreduzierten Tieren (LME: F = 0,05, p = 0,82; Fig. 2a). In ähnlicher Weise zeigte die spontane Wechselaufgabe keinen Unterschied zwischen Kontroll- und kalorienreduzierten Tieren (LME: F = 1,63, p = 0,22; 2b).
Die Autoren schlagen auch die Erklärung des Fehlens des Effekts vor - aber der entscheidende Punkt ist nicht die Erklärung, sondern die Behauptung selbst. Die zur Verfügung gestellten Darstellungen sehen für mich "auf den ersten Blick" deutlich anders aus (Abbildung 2).
Darüber hinaus ignorieren die Autoren die Vorkenntnisse:
Für Ratten sowie für zerebrale und emotionale Funktionen beim Menschen wurden schädliche Auswirkungen einer Kalorieneinschränkung auf die kognitive Leistung berichtet
Ich kann die gleiche Behauptung für die riesigen Stichprobengrößen verstehen (kein Effekt = kein praktisch signifikanter Effekt), aber in bestimmten Situationen wurden komplexe Tests verwendet und es ist für mich nicht offensichtlich, wie man Leistungsberechnungen durchführt.
Fragen:
Habe ich irgendwelche Details übersehen, die ihre Schlussfolgerungen bestätigen?
In Anbetracht der Notwendigkeit, negative Ergebnisse in der Wissenschaft zu melden , kann der Nachweis erbracht werden, dass es sich nicht um "das Fehlen von Ergebnissen" handelt (das wir mit ), sondern um ein negatives Ergebnis (z. B. gibt es keinen Unterschied zwischen Gruppen). Statistiken verwenden? Ich verstehe, dass bei großen Stichprobengrößen selbst kleine Abweichungen von Null eine Zurückweisung verursachen. Nehmen wir jedoch an, dass wir über ideale Daten verfügen und weiterhin nachweisen müssen, dass Null praktisch zutrifft.
Sollten Statistiker immer auf mathematisch korrekten Schlussfolgerungen bestehen wie "Mit dieser Fähigkeit konnten wir keine Auswirkungen von signifikanter Größe feststellen"? Forscher aus anderen Bereichen lehnen solche Formulierungen negativer Ergebnisse stark ab.
Ich würde mich über Gedanken zu dem Problem freuen und habe verwandte Fragen auf dieser Website gelesen und verstanden. Die Fragen 2) -3) sind aus statistischer Sicht eindeutig zu beantworten, aber ich möchte verstehen, wie diese Fragen im Falle eines interdisziplinären Dialogs zu beantworten sind.
UPD: Ich denke, ein gutes Beispiel für ein negatives Ergebnis ist die erste Stufe der medizinischen Prüfungen, die Sicherheit. Wann können Wissenschaftler entscheiden, dass das Medikament sicher ist? Ich denke, sie vergleichen zwei Gruppen und machen Statistiken über diese Daten. Gibt es eine Möglichkeit zu sagen, dass dieses Medikament sicher ist? Cochrane verwendet genaue "keine Nebenwirkungen gefunden wurden", aber die Ärzte sagen, dass dieses Medikament sicher ist. Wenn das Gleichgewicht zwischen Genauigkeit und Einfachheit der Beschreibung stimmt und wir sagen können, dass es keine Konsequenzen für die Gesundheit gibt?