Macht in der Proteomik?


9

Zuschüsse erfordern häufig eine Leistungsanalyse, um eine vorgeschlagene Stichprobengröße zu unterstützen. In der Proteomik (und den meisten -omics) gibt es 100 bis 1000 Merkmale / Variablen, die über 10 Proben gemessen werden (vielleicht 100, aber unwahrscheinlich). Es ist auch bekannt, dass einige dieser Maßeinheiten (z. B. Spektralzahlen von Proteinen) nicht normal verteilt sind, weshalb wir einen nichtparametrischen Test für die Analyse verwenden werden. Ich habe die Leistung einer Stichprobengröße unter der Annahme einer einzelnen Messung und eines T-Tests gesehen, aber ich denke nicht, dass dies völlig korrekt ist. Ein weiteres Problem bei der Spektralzählung besteht insbesondere darin, dass jedes der 100 Merkmale auf sehr unterschiedlichen Skalen mit sehr unterschiedlichen Fehlern vorliegt (größere Werte haben weniger Fehler). [Dieses Problem ist im Limit-Fold-Change-Modell, Mutch et al., 2002, gut beschrieben . ]

Was wäre der geeignete Weg, um die Leistung einer vorgeschlagenen Stichprobengröße unter Berücksichtigung einiger FDR-Annahmen und einer akzeptablen Faltveränderung zu bestimmen? Mit dem Tool hier konnte ich Folgendes feststellen:

  • 300 Gene
  • 3 falsch positive Ergebnisse
  • 1,4-fache Unterschiede
  • 0,8 gewünschte Leistung
  • 0,7 stdev

erfordert eine Stichprobengröße pro Gruppe von 49.

Dies war praktisch, da ich ein 50v50-Design vorschlage, weiß, dass eine 1,4-fache Änderung ziemlich akzeptiert ist, 1% FDR in Ordnung ist und ich wahrscheinlich 300 Proteine ​​in diesem Experiment messen werde. Dieses Problem der Berechnung der Leistung oder der Stichprobengröße wird weiterhin auftreten, daher wäre es schön, einen referenzierten Ansatz zu haben.

EDIT: Ich habe gelesen, wo ein Kollege vorgeschlagen hat, Spektralzählungen aus negativen Binominalverteilungen unter Verwendung der Wahrscheinlichkeitsfunktion, gefolgt von einem Wald-Test, zu modellieren. Grundsätzlich werden vorläufige Daten verwendet, um Proteinvarianzschätzungen zu erhalten und dann nachweisbare Faltungsänderungen zwischen Gruppen für jedes Quantil zu berechnen. Es gibt auch einen FDR (Alpha) -Eingang. Bei einer Leistung von> 80% und einer festgelegten Stichprobengröße können sie nachweisbare Faltungsänderungen für 25% niedrigste Varianz, 50% kleinere Varianz und 25% höchste Varianz bestimmen. Das Problem ist, dass ich nicht weiß, wie sie das gemacht haben. Ich bin mir nicht sicher, ob das Teilen dieses Ansatzes jemandem mit einer möglichen Antwort hilft.


Einige andere Ressourcen, die ich zu diesem Thema gefunden habe: Levin 2011 Dicker et al., 2010
Ben

1
Dieser MD Anderson-Rechner scheint mir zu optimistisch. Wie viele Vergleiche werden durchgeführt? (Ich bin auf Microarrays zu verrostet: 300 Gene in einem 50v50-Design bedeuten, dass Sie wie viele Vergleiche anstellen?) Wenn Sie den FDR-Rechner auf 3 falsch positive Ergebnisse einstellen, sagen Sie, dass Sie nur so einen falsch positiven Fehler setzen 3 werden voraussichtlich falsch positiv unter der Null sein? Das ist zu streng für mehr als 60 Vergleiche.
AdamO

1
Ich kann Ihnen zeigen, wie dies in R geschehen würde, aber ich brauche nur einige Hintergrundinformationen zur Biologie.
AdamO

Antworten:


1

In Anwendungen (insbesondere in ethischen Anwendungen, in denen Sie eine Leistungsstudie durchführen müssen) verwende ich diese Referenz gerne [Wang und Chen 2004], da sie das Konzept einer Leistungsberechnung für Hochdurchsatzdaten (unabhängig von den tatsächlichen Daten) gut erklärt. .

Im Wesentlichen verwenden Sie zusätzlich zu den üblichen Parametern (α, β, N, Effektgröße) zwei zusätzliche Parameter, λ und η. Letzteres, η, ist die angenommene Anzahl wirklich veränderter Gene, und λ ist der Anteil der wirklich veränderten Gene, die Sie nachweisen möchten. Mit diesem Ansatz ist es recht einfach, bekannte Leistungsberechnungen auf Daten mit hohem Durchsatz zu erweitern.

Wang, Sue-Jane und James J. Chen. "Probengröße zur Identifizierung differentiell exprimierter Gene in Microarray-Experimenten." Journal of Computational Biology 11.4 (2004): 714 & ndash; 726.

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.