Wie definieren wir reproduzierbare Forschung?


50

Dies ist jetzt in ein paar Fragen aufgetaucht, und ich habe mich über etwas gewundert. Hat sich das Feld insgesamt in Richtung "Reproduzierbarkeit" bewegt, wobei der Schwerpunkt auf der Verfügbarkeit der Originaldaten und des fraglichen Codes liegt?

Mir wurde immer beigebracht, dass der Kern der Reproduzierbarkeit nicht unbedingt die Fähigkeit ist, auf Ausführen zu klicken und dieselben Ergebnisse zu erzielen. Der Data-and-Code-Ansatz scheint davon auszugehen, dass die Daten korrekt sind - dass es keinen Fehler in der Sammlung der Daten selbst gibt (oft nachweislich falsch im Fall von wissenschaftlichem Betrug). Sie konzentriert sich auch auf eine einzelne Stichprobe der Zielpopulation und nicht auf die Reproduzierbarkeit des Befundes über mehrere unabhängige Stichproben.

Warum liegt der Schwerpunkt dann darauf, die Analyse wiederholen zu können, anstatt die Studie von Grund auf zu duplizieren?

Der in den Kommentaren unten erwähnte Artikel ist hier verfügbar .


Gute Frage ! Ich beziehe mich in meiner Antwort auf das Papier von Donoho, aber was sind Ihre schriftlichen Referenzen über reproduzierbare Forschung?
Robin Girard

Reiter und Kinney haben in der diesmonatigen Ausgabe von Epidemiology einen Artikel mit dem Titel "Vertrauliche Daten für Forschungszwecke freigeben: Ein Leitfaden" veröffentlicht, in dem erläutert wird, wie Code und Daten verfügbar gemacht werden, wenn Sie nicht einfach eine .csv-Datei hochwerfen können. und die Vertraulichkeit muss gewahrt bleiben.
Fomite

@EpiGrad, da "dieser Monat" vergangen ist, wäre ein Link zum Artikel hilfreich. Vielen Dank, dass Sie eine großartige Frage gestellt haben, die zum Lebenslauf und zur Wissenschafts- / Datenanalyse beiträgt!
gung - Reinstate Monica

@gung Welcher Artikel ist das?
Fomite

@EpiGrad gleich oben, Reiter & Kinney. Btw +1
Gung - wieder einzusetzen Monica

Antworten:


41

"Reproduzierbare Forschung" als reproduzierbare Analyse

Reproduzierbare Forschung ist ein Begriff, der in einigen Forschungsbereichen speziell für die Durchführung solcher Analysen verwendet wird

  • Code transformiert Rohdaten und Metadaten in verarbeitete Daten,
  • Code führt Analysen für die Daten aus und
  • Code integriert Analysen in einen Bericht.

Wenn solche Daten und Codes gemeinsam genutzt werden, können andere Forscher:

  • Analysen durchführen, die nicht von den ursprünglichen Forschern gemeldet wurden
  • Überprüfen Sie die Richtigkeit der von den ursprünglichen Forschern durchgeführten Analysen

Diese Verwendung kann in Diskussionen über Technologien wie Sweave gesehen werden . ZB schreibt Friedrich Leisch im Zusammenhang mit Sweave, dass "der Bericht automatisch aktualisiert werden kann, wenn sich Daten oder Analysen ändern, was eine wirklich reproduzierbare Forschung ermöglicht." Aus der CRAN-Task-Ansicht zur reproduzierbaren Forschung geht auch hervor , dass "das Ziel der reproduzierbaren Forschung darin besteht, spezifische Anweisungen an Datenanalysen und experimentelle Daten zu knüpfen, damit die Wissenschaft neu erstellt, besser verstanden und verifiziert werden kann".

Breitere Verwendung des Begriffs "Reproduzierbarkeit"

Reproduzierbarkeit ist ein grundlegendes Ziel der Wissenschaft. Es ist nicht neu Die Forschungsberichte enthalten Abschnitte mit Methoden und Ergebnissen, in denen dargelegt werden soll, wie die Daten generiert, verarbeitet und analysiert wurden. Eine allgemeine Regel ist, dass die bereitgestellten Details ausreichen sollten, um es einem entsprechend kompetenten Forscher zu ermöglichen, die bereitgestellten Informationen zu verwenden und die Studie zu replizieren.

Die Reproduzierbarkeit hängt auch eng mit den Konzepten der Reproduzierbarkeit und Verallgemeinerung zusammen.

Daher ist der Begriff "reproduzierbare Forschung", wie er wörtlich für Technologien wie Sweave verwendet wird, eine falsche Bezeichnung, da er eine Relevanz nahelegt, die breiter ist als sie abdeckt. Wenn Forscher, die solche Technologien nicht verwendet haben, Technologien wie Sweave vorstellen, wundern sich diese Forscher oft, wenn ich den Prozess als "reproduzierbare Forschung" bezeichne.

Ein besserer Begriff als "reproduzierbare Forschung"

Da "reproduzierbare Forschung", wie sie in Sweave-ähnlichen Kontexten verwendet wird, nur einen Aspekt reproduzierbarer Forschung betrifft, sollte möglicherweise ein alternativer Begriff verwendet werden. Mögliche Alternativen sind:

Alle oben genannten Begriffe spiegeln genauer wider, was Sweave-ähnliche Analysen beinhalten. Die reproduzierbare Analyse ist kurz und bündig. Das Hinzufügen von "Daten" oder "Statistik" verdeutlicht die Dinge weiter, führt aber auch dazu, dass der Begriff sowohl länger als auch enger wird. Darüber hinaus hat "statistisch" eine enge und eine breite Bedeutung, und innerhalb der engen Bedeutung ist ein Großteil der Datenverarbeitung nicht statistisch. Somit hat die Breite, die der Begriff "reproduzierbare Analyse" impliziert, seine Vorteile .

Es geht nicht nur um Reproduzierbarkeit

Das andere zusätzliche Problem mit dem Begriff "reproduzierbare Forschung" ist das Ziel, dass Sweave-ähnliche Technologien nicht nur "Reproduzierbarkeit" sind. Es gibt mehrere miteinander verbundene Ziele:

  • Reproduzierbarkeit
    • Können die Analysen einfach wiederholt werden, um Rohdaten mit denselben Ergebnissen in einen Abschlussbericht umzuwandeln?
  • Richtigkeit
    • Entspricht die Datenanalyse den Absichten des Forschers?
    • Sind die Absichten des Forschers richtig?
  • Offenheit
    • Transparenz, Rechenschaftspflicht
      • Können andere die Richtigkeit der durchgeführten Analysen überprüfen und verifizieren?
    • Erweiterbarkeit, Modifizierbarkeit
      • Können andere die Daten, Analysen oder beides ändern, erweitern, wiederverwenden und mischen, um neue Forschungsarbeiten zu erstellen?

Es gibt ein Argument, dass reproduzierbare Analysen korrekte Analysen fördern sollten, da es eine schriftliche Aufzeichnung von Analysen gibt, die überprüft werden können. Wenn Daten und Code gemeinsam genutzt werden, entsteht eine Rechenschaftspflicht, die die Forscher dazu motiviert, ihre Analysen zu überprüfen, und die es anderen Forschern ermöglicht, Korrekturen zu notieren.

Die reproduzierbare Analyse passt auch gut zu Konzepten rund um die offene Forschung. Natürlich kann ein Forscher Sweave-ähnliche Technologien nur für sich selbst verwenden. Offene Forschungsprinzipien fördern die gemeinsame Nutzung von Daten und Analysecode, um eine bessere Wiederverwendung und Rechenschaftspflicht zu ermöglichen.

Dies ist keine wirkliche Kritik an der Verwendung des Wortes "reproduzierbar". Es wird lediglich hervorgehoben, dass der Einsatz von Sweave-ähnlichen Technologien notwendig ist, aber nicht ausreicht, um offene wissenschaftliche Forschungsziele zu erreichen.


2
(+1) Tolle Antwort, sehr gute Punkte. Ich bin damit einverstanden, dass wir anrufen, was Sweave und Freunde reproduzierbar analysieren .
NRH

1
(+1) schöner Überblick. Ich möchte jedoch darauf hinweisen, dass der Begriff "Rohdaten" mehrdeutig ist und irreführend sein kann - Daten werden im Allgemeinen vor dem Stadium verarbeitet, in dem sie als "Rohdaten" betrachtet werden, wenn sie nur in die Maschine gelangen sollen.
David LeBauer

@Jeromy Anglim Dies ist eine großartige Antwort und bringt mich auf den Punkt, was mich an der Semantik der "reproduzierbaren Forschung" stört - sie wird verwendet, um einen Prozess zu beschreiben, der erst stattfindet, nachdem der Datenerzeugungsprozess abgeschlossen ist. Ich mag die Idee der "reproduzierbaren Analyse" als Begriff.
Fomite

+1 @Jeromy Anglim, ich habe kürzlich einen Autor kontaktiert, um zu sehen, ob er / sie den Rin der Veröffentlichung verwendeten Code teilen kann. Der Autor hat dies abgelehnt und mich auf die Veröffentlichung hingewiesen. Würden Sie dies Ihrer Meinung nach als mangelnde Offenheit für reproduzierbare Forschung ansehen oder ist es ausreichend, die Methodik im Journal zu verdeutlichen und andere den Code selbst programmieren zu lassen? Vielen Dank
Prognostiker

11

Der Zugriff auf die Daten und den Code für die Analyse in einer einfach auszuführenden Form ist eine unabdingbare Voraussetzung für reproduzierbare Forschung. Sobald Sie überprüft haben, dass die Analyse funktioniert, können Sie Ihren eigenen Code / Ihre eigenen Daten ersetzen, wenn Sie dem des ursprünglichen Autors skeptisch gegenüberstehen. Ich würde sagen, dass die Mehrheit der statistischen Artikel, die ich lese, mindestens einen Teil der Methodik enthält, der vage bleibt. Meine Versuche, diese Analysen zu reproduzieren, sind oft erfolglos (und immer zeitaufwendig), aber es ist sehr schwierig zu sagen, ob dies auf Betrug, menschliches Versagen oder (viel wahrscheinlicher) auf eine andere Lösung als der Autor zurückzuführen ist. Wenn Sie also Daten + Code für ein Papier haben, ist dies keine Garantie für die Richtigkeit der Schlussfolgerungen, aber es erleichtert die Kritik oder Erweiterung dieser Schlussfolgerungen erheblich.

Auch "reproduzierbare Forschung" ist eine Frage des Grades. Die reproduzierbare Forschungsbewegung kann daher als ermutigend angesehen werden, Forschung zu betreiben, die "reproduzierbarer" als die Norm ist, anstatt zu fordern, dass Forschung eine Mindestschwelle erreicht. Ich würde vermuten, dass "Daten und Code freigeben" derzeit in Mode ist, da dies ein relativ einfacher und nicht bedrohlicher Schritt ist.


9

Alles nachvollziehen zu können, ist ein Ausgangspunkt für die reproduzierbare Recherche. Es kann gezeigt werden, dass Sie tatsächlich dasselbe Verfahren anwenden. Danach - und erst danach - können Sie die Recherche Ihres Kollegen fortsetzen. Mit anderen Worten, die strikte Reproduzierbarkeit ist nicht als eine Zeit zu verstehen, in der die Forschung voranschreitet, sondern als ein Meilenstein, ein Konsens , über den sich die Menschen einig sind. Ist das nicht grundlegend, um weiterzukommen?

Laut der Diskussion von Donoho (siehe Abschnitt 2 "Der Skandal") besteht das Ziel reproduzierbarer Forschung auch darin, die Robustheit des gegebenen Codes zu testen. Spielen Sie zunächst mit dem Code, und nehmen Sie geringfügige Änderungen vor, die in der Arbeit nicht vorgenommen wurden (weil wir keine Arbeiten mit 30 Abbildungen möchten ...). Ich denke, das Konzept der reproduzierbaren Forschung in der Literatur beinhaltet die Idee, eine starke robuste Landmarke zu haben. Es enthält fast die Idee, weiter zu gehen.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.