Als «genetics» getaggte Fragen

Die wissenschaftliche Untersuchung der Vererbungsprinzipien und der Variation der vererbten Merkmale zwischen verwandten Organismen.

6
Featureauswahl für "endgültiges" Modell bei der Durchführung einer Gegenprüfung beim maschinellen Lernen
Ich bin etwas verwirrt über die Funktionsauswahl und das maschinelle Lernen und habe mich gefragt, ob Sie mir helfen könnten. Ich habe ein Microarray-Dataset, das in zwei Gruppen eingeteilt ist und über 1000 Funktionen verfügt. Mein Ziel ist es, eine kleine Anzahl von Genen (meine Merkmale) (10-20) in einer Signatur …

6
Wie wahrscheinlich ist es, dass ich von einer bestimmten Person abstamme, die im Jahr 1300 geboren wurde?
Mit anderen Worten, basierend auf dem Folgenden, was ist p? Um dies zu einem mathematischen Problem und nicht zu einem anthropologischen oder sozialwissenschaftlichen Problem zu machen und um das Problem zu vereinfachen, nehmen wir an, dass Partner mit der gleichen Wahrscheinlichkeit in der gesamten Bevölkerung ausgewählt werden, mit der Ausnahme, …

4
Korrigieren von p-Werten für mehrere Tests, bei denen Tests korreliert sind (Genetik)
Ich habe p-Werte aus vielen Tests und möchte wissen, ob es nach der Korrektur für mehrere Tests tatsächlich etwas Bedeutendes gibt. Die Komplikation: Meine Tests sind nicht unabhängig. Die Methode, über die ich nachdenke (eine Variante von Fisher's Product Method, Zaykin et al., Genet Epidemiol , 2002), benötigt die Korrelation …

4
Was sind die korrekten Werte für Präzision und Rückruf in Randfällen?
Präzision ist definiert als: p = true positives / (true positives + false positives) Ist es richtig, dass sich die Genauigkeit 1 nähert true positivesund false positivessich 0 nähert? Gleiche Frage zum Rückruf: r = true positives / (true positives + false negatives) Ich führe derzeit einen statistischen Test durch, …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 


1
Wie funktioniert die Quantilnormalisierung?
In Genexpressionsstudien mit Microarrays müssen Intensitätsdaten normalisiert werden, damit Intensitäten zwischen Individuen und Genen verglichen werden können. Konzeptionell und algorithmisch funktioniert die "Quantil-Normalisierung" und wie würden Sie dies einem Nicht-Statistiker erklären?

2
Berechnung der Wahrscheinlichkeit einer Überlappung der Genliste zwischen einer RNA-Sequenz und einem ChIP-Chip-Datensatz
Hoffentlich kann mir jemand in diesen Foren bei diesem Grundproblem in Genexpressionsstudien helfen. Ich habe eine Tiefensequenzierung eines experimentellen und eines Kontrollgewebes durchgeführt. Ich erhielt dann fache Anreicherungswerte von Genen in der experimentellen Probe über Kontrolle. Das Referenzgenom hat ~ 15.000 Gene. 3.000 von 15.000 Genen sind in meiner interessierenden …

2
Anreicherungsanalyse nach Gen-Duplikationsgrad
Biologischer Hintergrund Im Laufe der Zeit neigen einige Pflanzenarten dazu, ihr gesamtes Genom zu duplizieren und eine zusätzliche Kopie jedes Gens zu erhalten. Aufgrund der Instabilität dieses Aufbaus werden viele dieser Gene dann gelöscht, und das Genom ordnet sich neu und stabilisiert sich, bereit, erneut zu duplizieren. Diese Duplikationsereignisse sind …

1
Leistungsanalyse zur Überlebensanalyse
Wenn ich die Hypothese aufstelle, dass eine Gensignatur Personen mit einem geringeren Rezidivrisiko identifiziert, bedeutet dies eine Verringerung der Ereignisrate in 20% der Bevölkerung um 0,5 (Hazard Ratio von 0,5), und ich beabsichtige, Proben aus einer retrospektiven Kohortenstudie zu verwenden muss die Stichprobengröße für ungleiche Zahlen in den beiden hypothetischen …

2
Soft-Thresholding gegen Lasso-Bestrafung
Ich versuche, das, was ich bisher in der bestraften multivariaten Analyse verstanden habe, mit hochdimensionalen Datensätzen zusammenzufassen, und ich habe immer noch Schwierigkeiten, eine korrekte Definition von Soft-Thresholding vs. Lasso- Bestrafung (oder Bestrafung) zu erhalten.L1L1L_1 Genauer gesagt habe ich die spärliche PLS-Regression verwendet, um die 2-Block-Datenstruktur einschließlich genomischer Daten ( …




1
Wie berechnet man den Standardfehler der Quotenverhältnisse?
Ich habe zwei Datensätze aus genomweiten Assoziationsstudien. Die einzigen verfügbaren Informationen sind das Odds Ratio und der p-Wert für den ersten Datensatz. Für den zweiten Datensatz habe ich das Odds Ratio, den p-Wert und die Allelfrequenzen (AFD = Krankheit, AFC = Kontrollen) (zB: 0,321). Ich versuche, eine Metaanalyse dieser Daten …

4
Wie werden Konfidenzintervalle für gepoolte ungerade Verhältnisse in der Metaanalyse berechnet?
Ich habe zwei Datensätze aus genomweiten Assoziationsstudien. Die einzigen verfügbaren Informationen sind die ungeraden Verhältnisse und ihre Konfidenzintervalle (95%) für jedes genotypisierte SNP. Ich möchte ein Walddiagramm erstellen, in dem diese beiden Quotenverhältnisse verglichen werden, aber ich kann die kombinierten Konfidenzintervalle nicht berechnen, um die Zusammenfassungseffekte zu visualisieren. Ich habe …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.