Benjamini-Hochberg-Abhängigkeitsannahmen gerechtfertigt?

9

Ich habe einen Datensatz, in dem ich auf signifikante Unterschiede zwischen drei Populationen in Bezug auf etwa 50 verschiedene Variablen teste. Ich mache dies einerseits mit Kruskal-Wallis-Tests und andererseits mit Likelihood-Ratio-Tests für verschachtelte GLM-Modellanpassungen (mit und ohne Population als unabhängige Variable).

Als Ergebnis habe ich einerseits eine Liste von Kruskal-Wallis- Werten und andererseits Chi-Quadrat- Werte aus den LRT-Vergleichen. $p$ $p$

Ich muss eine Form der Mehrfachtestkorrektur durchführen, da es> 50 verschiedene Tests gibt, und Benjamini-Hochberg FDR scheint die vernünftigste Wahl zu sein.

Die Variablen sind jedoch wahrscheinlich nicht unabhängig, da mehrere "Clans" von ihnen korreliert sind. Die Frage ist dann: Wie kann ich feststellen, ob die zugrunde liegenden Statistiken für meine Werte die Anforderungen an die positive Abhängigkeit erfüllen, die erforderlich sind, damit das Benjamini-Hochberg-Verfahren noch an den FDR gebunden ist? $p$

Das Benjamini-Hochberg-Yekutieli-Papier von 2001 besagt, dass die PRDS-Bedingung für die multivariate Normalverteilung und die studentisierte Verteilung gilt. Was ist mit meinen Likelihood-Ratio-Test-Chi-Quadrat-Werten für den Modellvergleich? Was ist mit den Werten, die ich für die Kruskal-Wallis-Tests habe? $p$

Ich kann die Benjamini-Hochberg-Yekutieli-FDR-Korrektur im ungünstigsten Fall verwenden, die nichts von der Abhängigkeit voraussetzt, aber ich denke, dass sie in diesem Fall zu konservativ ist und einige relevante Signale übersieht.

— user14867
quelle

3

Die Gültigkeit des BH-Verfahrens hängt davon ab, ob die Hypothesentests positiv abhängig sind. Wenn Sie ihre Arbeit von 2001 lesen, werden Sie sehen, dass es nicht notwendig ist, multivariat normal zu sein. Sie gaben schwache Bedingungen in der Arbeit an:

Rosenbaums (1984) bedingte (positive) Assoziation reicht aus, um PRDS zu implizieren: ist bedingt assoziiert, wenn für eine Partition von und eine Funktion mit positiv assoziiert ist . $X$ $(X1,$ $X2)$ $X$ $h(X1), X2$ $h(X1)$

Wenn dies als vernünftige Annahme für Ihre Daten erscheint, deklarieren Sie sie einfach als Annahme und versuchen Sie, Szenarien zu entwickeln, in denen sie erfüllt sind und nicht, um sie für sich selbst zu klären.

— guest47
quelle

Können Sie einen Verweis auf dieses Papier geben?

— user603

3

PRDS ist eine ausreichende, aber nicht notwendige Bedingung für BH, um den FDR zu kontrollieren. Ich würde vorschlagen, dass Sie es verwenden und auch das Benjamini-Yekutieli-Verfahren für allgemeine Abhängigkeit verwenden. Wenn der Unterschied in der Inferenz groß ist, versuchen Sie zu demonstrieren, dass BH den FDR in Ihrem speziellen Setup mithilfe von Permutationen oder Resampling-basierten Techniken steuert, die Ihre Abhängigkeitsstruktur erhalten.

— JohnRos
quelle