Ich mag G van Belles Buch über statistische Faustregeln und in geringerem Maße allgemeine Fehler in der Statistik (und wie man sie vermeidet) von Phillip I Good und James W. Hardin. Sie adressieren häufige Fallstricke bei der Interpretation von Ergebnissen aus experimentellen Studien und Beobachtungsstudien und geben praktische Empfehlungen für statistische Schlussfolgerungen oder explorative Datenanalysen. Ich bin jedoch der Meinung, dass "moderne" Leitlinien etwas fehlen, insbesondere angesichts des zunehmenden Einsatzes von rechnergestützten und robusten Statistiken in verschiedenen Bereichen oder der Einführung von Techniken aus der Community des maschinellen Lernens, z. B. in der klinischen Biostatistik oder der genetischen Epidemiologie.
Abgesehen von Rechentricks oder häufigen Fallstricken bei der Datenvisualisierung, die an anderer Stelle behoben werden könnten, möchte ich fragen: Welche Faustregeln würden Sie für eine effiziente Datenanalyse empfehlen? ( eine Regel pro Antwort, bitte ).
Ich denke an Richtlinien, die Sie einem Kollegen, einem Forscher ohne fundierten Hintergrund in der statistischen Modellierung oder einem Studenten im Mittel- bis Fortgeschrittenenkurs geben könnten. Dies kann verschiedene Phasen der Datenanalyse betreffen, z. B. Stichprobenstrategien, Merkmalsauswahl oder Modellbildung, Modellvergleich, Nachschätzung usw.