Ich bin etwas verwirrt über die Funktionsauswahl und das maschinelle Lernen und habe mich gefragt, ob Sie mir helfen könnten. Ich habe ein Microarray-Dataset, das in zwei Gruppen eingeteilt ist und über 1000 Funktionen verfügt. Mein Ziel ist es, eine kleine Anzahl von Genen (meine Merkmale) (10-20) in einer Signatur …
Mit anderen Worten, basierend auf dem Folgenden, was ist p? Um dies zu einem mathematischen Problem und nicht zu einem anthropologischen oder sozialwissenschaftlichen Problem zu machen und um das Problem zu vereinfachen, nehmen wir an, dass Partner mit der gleichen Wahrscheinlichkeit in der gesamten Bevölkerung ausgewählt werden, mit der Ausnahme, …
Ich habe p-Werte aus vielen Tests und möchte wissen, ob es nach der Korrektur für mehrere Tests tatsächlich etwas Bedeutendes gibt. Die Komplikation: Meine Tests sind nicht unabhängig. Die Methode, über die ich nachdenke (eine Variante von Fisher's Product Method, Zaykin et al., Genet Epidemiol , 2002), benötigt die Korrelation …
Präzision ist definiert als: p = true positives / (true positives + false positives) Ist es richtig, dass sich die Genauigkeit 1 nähert true positivesund false positivessich 0 nähert? Gleiche Frage zum Rückruf: r = true positives / (true positives + false negatives) Ich führe derzeit einen statistischen Test durch, …
In genomweiten Assoziationsstudien (GWAS): Was sind die Hauptkomponenten? Warum werden sie verwendet? Wie werden sie berechnet? Kann eine genomweite Assoziationsstudie ohne PCA durchgeführt werden?
In Genexpressionsstudien mit Microarrays müssen Intensitätsdaten normalisiert werden, damit Intensitäten zwischen Individuen und Genen verglichen werden können. Konzeptionell und algorithmisch funktioniert die "Quantil-Normalisierung" und wie würden Sie dies einem Nicht-Statistiker erklären?
Hoffentlich kann mir jemand in diesen Foren bei diesem Grundproblem in Genexpressionsstudien helfen. Ich habe eine Tiefensequenzierung eines experimentellen und eines Kontrollgewebes durchgeführt. Ich erhielt dann fache Anreicherungswerte von Genen in der experimentellen Probe über Kontrolle. Das Referenzgenom hat ~ 15.000 Gene. 3.000 von 15.000 Genen sind in meiner interessierenden …
Biologischer Hintergrund Im Laufe der Zeit neigen einige Pflanzenarten dazu, ihr gesamtes Genom zu duplizieren und eine zusätzliche Kopie jedes Gens zu erhalten. Aufgrund der Instabilität dieses Aufbaus werden viele dieser Gene dann gelöscht, und das Genom ordnet sich neu und stabilisiert sich, bereit, erneut zu duplizieren. Diese Duplikationsereignisse sind …
Wenn ich die Hypothese aufstelle, dass eine Gensignatur Personen mit einem geringeren Rezidivrisiko identifiziert, bedeutet dies eine Verringerung der Ereignisrate in 20% der Bevölkerung um 0,5 (Hazard Ratio von 0,5), und ich beabsichtige, Proben aus einer retrospektiven Kohortenstudie zu verwenden muss die Stichprobengröße für ungleiche Zahlen in den beiden hypothetischen …
Ich versuche, das, was ich bisher in der bestraften multivariaten Analyse verstanden habe, mit hochdimensionalen Datensätzen zusammenzufassen, und ich habe immer noch Schwierigkeiten, eine korrekte Definition von Soft-Thresholding vs. Lasso- Bestrafung (oder Bestrafung) zu erhalten.L1L1L_1 Genauer gesagt habe ich die spärliche PLS-Regression verwendet, um die 2-Block-Datenstruktur einschließlich genomischer Daten ( …
Warum sollte man in einer genetischen Assoziationsstudie Alter und Altersquadrat als Kovariaten verwenden? Ich kann die Verwendung des Alters verstehen, wenn es als signifikante Kovariate identifiziert wurde, aber ich bin hinsichtlich der Verwendung des Alters im Quadrat ratlos.
Ich habe eine Matrix, wobei die Anzahl der Gene und die Anzahl der Patienten ist. Jeder, der mit solchen Daten gearbeitet hat, weiß, dass immer größer als . Bei Verwendung der Merkmalsauswahl habe ich auf eine vernünftigere Zahl gebracht, jedoch ist immer noch größer als .p n p n p …
Nehmen Sie 20 zufällige Punkte in einem 10.000-dimensionalen Raum mit jeder Koordinate iid aus . Teilen Sie sie in 10 Paare ("Paare") auf und addieren Sie den Durchschnitt jedes Paares ("ein Kind") zum Datensatz. Führen Sie dann PCA für die resultierenden 30 Punkte durch und zeichnen Sie PC1 gegen PC2.N.( …
Ich habe zwei Datensätze aus genomweiten Assoziationsstudien. Die einzigen verfügbaren Informationen sind das Odds Ratio und der p-Wert für den ersten Datensatz. Für den zweiten Datensatz habe ich das Odds Ratio, den p-Wert und die Allelfrequenzen (AFD = Krankheit, AFC = Kontrollen) (zB: 0,321). Ich versuche, eine Metaanalyse dieser Daten …
Ich habe zwei Datensätze aus genomweiten Assoziationsstudien. Die einzigen verfügbaren Informationen sind die ungeraden Verhältnisse und ihre Konfidenzintervalle (95%) für jedes genotypisierte SNP. Ich möchte ein Walddiagramm erstellen, in dem diese beiden Quotenverhältnisse verglichen werden, aber ich kann die kombinierten Konfidenzintervalle nicht berechnen, um die Zusammenfassungseffekte zu visualisieren. Ich habe …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.