In [1, §3.2] schlägt David Freedman eine im Wesentlichen negative Antwort auf Ihre Frage vor. Das heißt, kein (bloßes) statistisches Modell oder Algorithmus könnte das Problem von John Snow lösen. Schnees Problem bestand darin, ein kritisches Argument zu entwickeln, das seine Theorie, dass Cholera eine durch Wasser übertragene Infektionskrankheit ist, gegen die vorherrschende Miasma-Theorie seiner Zeit stützt . (Kapitel 3 in [1] mit dem Titel „Statistical Models and Shoe Leather“ ist auch in der zuvor veröffentlichten Form [2] hier verfügbar .)
In diesen wenigen kurzen Seiten [1, S. 47–53], von denen ein Großteil ein ausführliches Zitat von John Snow selbst ist, argumentiert Freedman, dass "das, was Snow 1853–54 tat, noch interessanter ist als die Fabel [des Broad Street Pump]. " Was das Sammeln statistischer Beweise anbelangt (andere vorbereitende Maßnahmen wie die Identifizierung von Indexfällen usw.), nutzte Snow die natürliche Variation , um ein wirklich bemerkenswertes Quasi-Experiment durchzuführen.
Es stellte sich heraus, dass es zu einem früheren Zeitpunkt in London einen heftigen Wettbewerb zwischen den Wasserversorgungsunternehmen gab, und dies führte zu einer räumlichen Vermischung der Wasserversorgung, die (in Schnees Worten) "von der intimsten Art" war.
Die Pfeifen jeder Kompanie verlaufen auf allen Straßen und in fast allen Gerichten und Gassen. Ein paar Häuser werden von einem Unternehmen und ein paar von dem anderen nach der Entscheidung des Eigentümers oder des Eigentümers zu der Zeit geliefert, als die Wasserunternehmen in einem aktiven Wettbewerb standen.
...
Da es keinen Unterschied zwischen den Häusern oder den Menschen gibt, die die Versorgung der beiden Wasserversorgungsunternehmen erhalten, oder zwischen den physischen Bedingungen, mit denen sie umgeben sind, ist es offensichtlich, dass kein Experiment hätte ausgedacht werden können, das die Situation gründlicher testen würde Auswirkung der Wasserversorgung auf das Fortschreiten der Cholera als diese, welche Umstände dem Betrachter bereit gestellt wurden.
- John Snow
Ein weiteres kritisch wichtiges Stück „natürlicher Variation“, das John Snow in diesem Quasi-Experiment ausnutzte, war die Tatsache, dass eine Wasserversorgung an der Themse stromabwärts von Abwassereinleitungen betrieben wurde , während die andere einige Jahre zuvor ihre Versorgung stromaufwärts verlagerte . Ich lasse Sie raten, welches aus John Snow's Datentabelle stammt!
| Anzahl der | Cholera | Todesfälle pro
Unternehmen | Häuser | Todesfälle 10.000 Häuser
-------------------------------------------------- --------
Southwark & Vauxhall | 40,046 | 1263 | 315
Lambeth | 26,107 | 98 | 37
Rest von London | 256,423 | 1422 | 59
Wie Freedman verwelkt bemerkt,
Als ein Stück statistischer Technologie ist [die obige Tabelle] keineswegs bemerkenswert. Aber die Geschichte, die es erzählt, ist sehr überzeugend. Die Stärke des Arguments ergibt sich aus der Klarheit der vorherigen Überlegungen, der Zusammenführung vieler verschiedener Beweislinien und der Menge an Schuhleder, die Snow bereit war, zu verwenden, um die Daten zu erhalten. [1, S.51]
Ein weiterer Punkt der natürlichen Variation von Schnee ausgebeutet ereignete sich in der Zeit Dimension: die oben genannte Verlagerung Wasseraufnahme erfolgte zwischen zwei Epidemien, so dass Schnee die gleiche Firma , Wasser mit und ohne Zusatz von Abwasser zu vergleichen. (Dank an Philip B. Stark, einen Autor von [1], für diese Info über Twitter . Siehe diesen Online-Vortrag von ihm.)
Diese Angelegenheit liefert auch eine lehrreiche Studie über den Kontrast zwischen Deduktivismus und Induktivismus , wie in dieser Antwort diskutiert .
Freedman D, Collier D, Sekhon JS, Stark PB. Statistische Modelle und kausale Folgerungen: Ein Dialog mit den Sozialwissenschaften. Cambridge; New York: Cambridge University Press; 2010.
Freedman DA. Statistische Modelle und Schuhleder. Soziologische Methodik . 1991; 21: 291 & ndash; 313. doi: 10.2307 / 270939. Voller Text