Ich denke, es ist wichtig, sich daran zu erinnern, dass verschiedene Methoden für verschiedene Dinge gut sind und Signifikanztests nicht alles sind, was es in der Welt der Statistik gibt.
1 und 3) EB ist wahrscheinlich kein gültiges Verfahren zum Testen von Hypothesen, sollte es aber auch nicht sein.
Gültigkeit kann vieles sein, aber Sie sprechen von rigorosem experimentellem Design. Wir diskutieren daher wahrscheinlich einen Hypothesentest, der Ihnen helfen soll, mit einer bestimmten langfristigen Häufigkeit die richtige Entscheidung zu treffen. Dies ist eine streng dichotome Ja / Nein-Regelung, die vor allem für Menschen nützlich ist, die eine Ja / Nein-Entscheidung treffen müssen. Es gibt in der Tat eine Menge klassischer Arbeiten von sehr klugen Leuten. Diese Methoden haben eine gute theoretische Gültigkeit im Grenzbereich, vorausgesetzt, dass alle Ihre Annahmen zutreffen, & c. EB war jedoch sicherlich nicht dafür gedacht. Wenn Sie die Maschinerie der klassischen NHST-Methoden wollen, halten Sie sich an die klassischen NHST-Methoden.
2) EB wird am besten bei Problemen angewendet, bei denen Sie viele ähnliche, variable Größen schätzen.
Efron selbst eröffnet sein Buch Large-Scale Inference, in dem drei verschiedene Epochen der Statistikgeschichte aufgeführt sind
[die] Ära der wissenschaftlichen Massenproduktion, in der neue Technologien, die für das Microarray typisch sind, einem einzelnen Wissenschaftlerteam die Erstellung von Datensätzen einer Größe ermöglichen, um die Quetelet beneiden würde. Aber jetzt geht die Datenflut mit einer Flut von Fragen einher, vielleicht mit Tausenden von Schätzungen oder Hypothesentests, die der Statistiker gemeinsam zu beantworten hat. überhaupt nicht, was die klassischen Meister im Sinn hatten.
Er fährt fort:
Empirische Bayes-Argumente kombinieren naturgemäß häufig auftretende und bayesianische Elemente, um Probleme wiederholter Strukturen zu analysieren. Wiederholte Strukturen sind genau das, was die wissenschaftliche Massenproduktion zum Beispiel bei Expressionsniveaus, bei denen kranke und gesunde Probanden mit Hilfe von Microarrays für Tausende von Genen gleichzeitig verglichen werden, auszeichnet.
Vielleicht ist die erfolgreichste jüngste Anwendung von EB ist limma
, auf Bioconductor verfügbar . Dies ist ein R-Paket mit Methoden zur Bewertung der differentiellen Expression (dh Microarrays) zwischen zwei Studiengruppen über Zehntausende von Genen. Smyth zeigt, dass ihre EB-Methoden eine t-Statistik mit mehr Freiheitsgraden liefern, als wenn Sie reguläre gen-weise t-Statistiken berechnen würden. Die Verwendung von EB ist hier "gleichbedeutend mit einer Schrumpfung der geschätzten Stichprobenvarianzen in Richtung einer gepoolten Schätzung, was zu einer weitaus stabileren Schlussfolgerung führt, wenn die Anzahl der Arrays klein ist", was häufig der Fall ist.
Wie Efron oben ausgeführt hat, ist dies nicht das, wofür das klassische NHST entwickelt wurde, und die Umgebung ist in der Regel eher explorativ als konfirmatorisch.
4) Im Allgemeinen können Sie EB als eine Schrumpfungsmethode betrachten, und es kann überall dort nützlich sein, wo das Schrumpfen nützlich ist
limma
X1, . . . , Xkθ^JSich= ( 1 - c / s2) Xich,S2= ∑kj = 1Xj,cXich
X¯,
Je ähnlicher die zu schätzenden Größen sind, desto wahrscheinlicher ist es, dass eine Schrumpfung sinnvoll ist. Das Buch, auf das Sie verweisen, verwendet Trefferquoten im Baseball. Morris (1983) weist auf eine Handvoll anderer Anwendungen hin:
- Einnahmenbeteiligung --- Volkszählungsbüro. Schätzung des Pro-Kopf-Zensus-Einkommens für mehrere Gebiete.
- Qualitätssicherung --- Bell Labs. Schätzt die Anzahl der Fehler für verschiedene Zeiträume.
- Versicherungstarif. Schätzt das Risiko pro Exposition für Gruppen von Versicherten oder für verschiedene Gebiete.
- Zulassung zum Jurastudium. Geschätztes Gewicht für die LSAT-Punktzahl im Verhältnis zur GPA für verschiedene Schulen.
- Feuermelder --- NYC. Schätzt die Falschalarmrate für verschiedene Alarmboxstandorte.
Dies sind alles Parallelschätzungsprobleme und soweit ich weiß, geht es eher darum, eine gute Vorhersage darüber zu treffen, was eine bestimmte Größe ist, als eine Ja / Nein-Entscheidung zu treffen.
Einige Referenzen
- Efron, B. (2012). Inferenz in großem Maßstab: empirische Bayes-Methoden zur Abschätzung, Prüfung und Vorhersage (Band 1). Cambridge University Press. Chicago
- B. Efron & C. Morris (1973). Steins Schätzregel und ihre Konkurrenten - ein empirischer Bayes-Ansatz. Journal of the American Statistical Association, 68 (341), 117-130. Chicago
- James, W. & Stein, C. (1961, Juni). Schätzung mit quadratischem Verlust. In Proceedings of the 4th Berkeley Symposium über mathematische Statistik und Wahrscheinlichkeit (Vol. 1, Nr. 1961, S. 361-379). Chicago
- Morris, CN (1983). Parametrische empirische Bayes-Folgerung: Theorie und Anwendungen. Journal of the American Statistical Association, 78 (381), 47-55.
- Smyth, GK (2004). Lineare Modelle und empirische Bayes-Methoden zur Beurteilung der differentiellen Expression in Microarray-Experimenten. Statistische Anwendungen in der Genetik und Molekularbiologie Band 3, Ausgabe 1, Artikel 3.