Zuschüsse erfordern häufig eine Leistungsanalyse, um eine vorgeschlagene Stichprobengröße zu unterstützen. In der Proteomik (und den meisten -omics) gibt es 100 bis 1000 Merkmale / Variablen, die über 10 Proben gemessen werden (vielleicht 100, aber unwahrscheinlich). Es ist auch bekannt, dass einige dieser Maßeinheiten (z. B. Spektralzahlen von Proteinen) nicht normal verteilt sind, weshalb wir einen nichtparametrischen Test für die Analyse verwenden werden. Ich habe die Leistung einer Stichprobengröße unter der Annahme einer einzelnen Messung und eines T-Tests gesehen, aber ich denke nicht, dass dies völlig korrekt ist. Ein weiteres Problem bei der Spektralzählung besteht insbesondere darin, dass jedes der 100 Merkmale auf sehr unterschiedlichen Skalen mit sehr unterschiedlichen Fehlern vorliegt (größere Werte haben weniger Fehler). [Dieses Problem ist im Limit-Fold-Change-Modell, Mutch et al., 2002, gut beschrieben . ]
Was wäre der geeignete Weg, um die Leistung einer vorgeschlagenen Stichprobengröße unter Berücksichtigung einiger FDR-Annahmen und einer akzeptablen Faltveränderung zu bestimmen? Mit dem Tool hier konnte ich Folgendes feststellen:
- 300 Gene
- 3 falsch positive Ergebnisse
- 1,4-fache Unterschiede
- 0,8 gewünschte Leistung
- 0,7 stdev
erfordert eine Stichprobengröße pro Gruppe von 49.
Dies war praktisch, da ich ein 50v50-Design vorschlage, weiß, dass eine 1,4-fache Änderung ziemlich akzeptiert ist, 1% FDR in Ordnung ist und ich wahrscheinlich 300 Proteine in diesem Experiment messen werde. Dieses Problem der Berechnung der Leistung oder der Stichprobengröße wird weiterhin auftreten, daher wäre es schön, einen referenzierten Ansatz zu haben.
EDIT: Ich habe gelesen, wo ein Kollege vorgeschlagen hat, Spektralzählungen aus negativen Binominalverteilungen unter Verwendung der Wahrscheinlichkeitsfunktion, gefolgt von einem Wald-Test, zu modellieren. Grundsätzlich werden vorläufige Daten verwendet, um Proteinvarianzschätzungen zu erhalten und dann nachweisbare Faltungsänderungen zwischen Gruppen für jedes Quantil zu berechnen. Es gibt auch einen FDR (Alpha) -Eingang. Bei einer Leistung von> 80% und einer festgelegten Stichprobengröße können sie nachweisbare Faltungsänderungen für 25% niedrigste Varianz, 50% kleinere Varianz und 25% höchste Varianz bestimmen. Das Problem ist, dass ich nicht weiß, wie sie das gemacht haben. Ich bin mir nicht sicher, ob das Teilen dieses Ansatzes jemandem mit einer möglichen Antwort hilft.