Als «bioinformatics» getaggte Fragen

Die Disziplin an der Schnittstelle zwischen Computer und Biowissenschaften, die das Organisieren, Verwalten und Analysieren von Daten aus Bereichen wie Molekularbiologie, Genetik und Genomik umfasst

11
Ressourcen zum Erlernen der Markov-Kette und versteckter Markov-Modelle
Ich suche nach Ressourcen (Tutorials, Lehrbücher, Webcasts usw.), um mehr über Markov Chain und HMMs zu erfahren. Ich bin Biologe und arbeite derzeit in einem bioinformatischen Projekt. Welchen mathematischen Hintergrund benötige ich, um Markov-Modelle und HMMs ausreichend zu verstehen? Ich habe mich mit Google umgesehen, aber bisher habe ich noch …

3
Interpretation des log transformierten Prädiktors und / oder der Antwort
Ich frage mich, ob es einen Unterschied in der Interpretation macht, ob nur die abhängigen, sowohl die abhängigen als auch die unabhängigen Variablen oder nur die unabhängigen Variablen log-transformiert werden. Betrachten Sie den Fall von log(DV) = Intercept + B1*IV + Error Ich kann die IV als prozentuale Erhöhung interpretieren, …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
Kontinuierliche Verallgemeinerung der negativen Binomialverteilung
Die negative Binomialverteilung (NB) ist für nicht negative ganze Zahlen definiert und hat die WahrscheinlichkeitsmassenfunktionIst es sinnvoll, eine kontinuierliche Verteilung auf nicht negative Reelle zu betrachten, die durch dieselbe Formel definiert sind (wobei durch )? Der Binomialkoeffizient kann als ein Produkt von umgeschrieben werden , das für jedes reelle gut …

4
Was können wir aus künstlichen neuronalen Netzen über das menschliche Gehirn lernen?
Ich weiß, dass meine Frage / mein Titel nicht sehr spezifisch ist, deshalb werde ich versuchen, es zu klären: Künstliche neuronale Netze sind relativ streng aufgebaut. Natürlich werden sie im Allgemeinen von der Biologie beeinflusst und versuchen, ein mathematisches Modell realer neuronaler Netze zu erstellen, aber unser Verständnis realer neuronaler …

3
Kann der MIC-Algorithmus zur Erkennung nichtlinearer Korrelationen intuitiv erklärt werden?
Kürzlich habe ich zwei Artikel gelesen. Erstens geht es um die Geschichte der Korrelation und zweitens um die neue Methode mit dem Namen Maximal Information Coefficient (MIC). Ich benötige Ihre Hilfe zum Verständnis der MIC-Methode zur Schätzung nichtlinearer Korrelationen zwischen Variablen. Eine Anleitung zur Verwendung in R finden Sie außerdem …

2
Trainingsansätze für stark unausgeglichene Datensätze
Ich habe einen stark unausgeglichenen Testdatensatz. Die positive Menge besteht aus 100 Fällen, während die negative Menge aus 1500 Fällen besteht. Auf der Trainingsseite habe ich einen größeren Kandidatenpool: Der positive Trainingssatz umfasst 1200 Fälle und der negative Trainingssatz umfasst 12000 Fälle. Für diese Art von Szenario habe ich mehrere …

4
Festlegung der negativen Binomialverteilung für die DNA-Sequenzierung
Die negative Binomialverteilung hat sich in der Bioinformatik zu einem beliebten Modell für Zähldaten (insbesondere die erwartete Anzahl von Sequenzierungslesevorgängen innerhalb einer bestimmten Region des Genoms aus einem bestimmten Experiment) entwickelt. Erklärungen variieren: Einige erklären es als etwas, das wie die Poisson-Verteilung funktioniert, aber einen zusätzlichen Parameter hat, der mehr …


7
Statistiktheorie und -anwendungen sinnvoll nutzen
Ich habe vor kurzem meinen Master in medizinischer und biologischer Modellierung abgeschlossen, begleitet von Ingenieurmathematik als Hintergrund. Obwohl mein Ausbildungsprogramm eine beträchtliche Anzahl von Kursen in mathematischer Statistik (siehe unten für eine Liste) enthielt, die ich mit ziemlich hohen Noten absolvierte, habe ich es häufig völlig verloren, sowohl auf Theorie …

2
Berechnung der Wahrscheinlichkeit einer Überlappung der Genliste zwischen einer RNA-Sequenz und einem ChIP-Chip-Datensatz
Hoffentlich kann mir jemand in diesen Foren bei diesem Grundproblem in Genexpressionsstudien helfen. Ich habe eine Tiefensequenzierung eines experimentellen und eines Kontrollgewebes durchgeführt. Ich erhielt dann fache Anreicherungswerte von Genen in der experimentellen Probe über Kontrolle. Das Referenzgenom hat ~ 15.000 Gene. 3.000 von 15.000 Genen sind in meiner interessierenden …

2
Anreicherungsanalyse nach Gen-Duplikationsgrad
Biologischer Hintergrund Im Laufe der Zeit neigen einige Pflanzenarten dazu, ihr gesamtes Genom zu duplizieren und eine zusätzliche Kopie jedes Gens zu erhalten. Aufgrund der Instabilität dieses Aufbaus werden viele dieser Gene dann gelöscht, und das Genom ordnet sich neu und stabilisiert sich, bereit, erneut zu duplizieren. Diese Duplikationsereignisse sind …

1
Warum haben Anova () und drop1 () unterschiedliche Antworten für GLMMs geliefert?
Ich habe ein GLMM der Form: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Wenn ich benutze drop1(model, test="Chi"), erhalte ich andere Ergebnisse als wenn ich Anova(model, type="III")aus dem Autopaket oder benutze summary(model). Diese beiden letzteren geben die gleichen Antworten. Unter Verwendung einer Reihe …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
Was ist der Unterschied zwischen Statistik und Informatik?
Wir sagen immer, dass Statistiken nur Daten betreffen. Wir wissen aber auch, dass die Informatik auch Wissen aus der Datenanalyse erhält. Zum Beispiel können Menschen der Bioinformatik ganz auf Biostatistik verzichten. Ich möchte wissen, was der wesentliche Unterschied zwischen Statistik und Informatik ist.


1
Welches Deep-Learning-Modell kann Kategorien klassifizieren, die sich nicht gegenseitig ausschließen?
Beispiele: Ich habe einen Satz in der Stellenbeschreibung: "Java Senior Engineer in UK". Ich möchte ein Deep-Learning-Modell verwenden, um es als zwei Kategorien vorherzusagen: English und IT jobs. Wenn ich ein traditionelles Klassifizierungsmodell verwende, kann es nur 1 Etikett mit softmaxFunktion auf der letzten Ebene vorhersagen . Somit kann ich …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.