Als «censoring» getaggte Fragen

Der Prozess der Zensur liefert Daten mit nur Teilinformationen. Das häufigste Beispiel für Zensur ist die * richtige Zensur * in der Überlebensanalyse, bei der bekannt ist, dass die Zeit bis zum Eintreten des Ereignisses nur länger als eine gewisse Dauer ist, da das Ereignis zum Ende der Studie nicht eingetreten war.

3
Ein Beispiel: LASSO-Regression unter Verwendung von glmnet für binäre Ergebnisse
Ich beginne mit der Verwendung von dabble glmnetmit LASSO Regression , wo mein Ergebnis von Interesse dichotomous ist. Ich habe unten einen kleinen nachgebildeten Datenrahmen erstellt: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


3
Warum gibt es einen Unterschied zwischen der manuellen Berechnung eines Konfidenzintervalls für eine logistische Regression von 95% und der Verwendung der Funktion confint () in R?
Sehr geehrte Damen und Herren, mir ist etwas Merkwürdiges aufgefallen, das ich Ihnen nicht erklären kann. Zusammenfassend lässt sich sagen, dass der manuelle Ansatz zur Berechnung eines Konfidenzintervalls in einem logistischen Regressionsmodell und die R-Funktion confint()unterschiedliche Ergebnisse liefern. Ich habe die angewandte logistische Regression von Hosmer & Lemeshow (2. Auflage) …
34 r  regression  logistic  confidence-interval  profile-likelihood  correlation  mcmc  error  mixture  measurement  data-augmentation  r  logistic  goodness-of-fit  r  time-series  exponential  descriptive-statistics  average  expected-value  data-visualization  anova  teaching  hypothesis-testing  multivariate-analysis  r  r  mixed-model  clustering  categorical-data  unsupervised-learning  r  logistic  anova  binomial  estimation  variance  expected-value  r  r  anova  mixed-model  multiple-comparisons  repeated-measures  project-management  r  poisson-distribution  control-chart  project-management  regression  residuals  r  distributions  data-visualization  r  unbiased-estimator  kurtosis  expected-value  regression  spss  meta-analysis  r  censoring  regression  classification  data-mining  mixture 

2
Was ist der Unterschied zwischen Zensur und Kürzung?
In dem Buch Statistische Modelle und Methoden für Lebensdauerdaten heißt es: Zensieren: Wenn eine Beobachtung aufgrund einer zufälligen Ursache unvollständig ist. Trunkierung: Wenn die Unvollständigkeit der Beobachtung auf einen systematischen Auswahlprozess zurückzuführen ist, der dem Studiendesign eigen ist. Was bedeutet "systematischer Auswahlprozess, der dem Studiendesign inhärent ist" in der Definition …

3
Wie man diese ungerade Verteilung modelliert (fast ein umgekehrtes J)
Die unten angezeigte abhängige Variable passt nicht zu einer mir bekannten Aktienverteilung. Die lineare Regression erzeugt nicht ganz normale, rechtsgerichtete Residuen, die sich auf ungerade Weise auf das vorhergesagte Y beziehen (2. Diagramm). Irgendwelche Vorschläge für Transformationen oder andere Wege, um die validesten Ergebnisse und die beste Vorhersagegenauigkeit zu erzielen? …

3
Unvoreingenommene Schätzung der Kovarianzmatrix für mehrfach zensierte Daten
Chemische Analysen von Umweltproben werden im Folgenden häufig an Meldegrenzen oder verschiedenen Nachweis- / Bestimmungsgrenzen zensiert. Letztere können variieren, normalerweise proportional zu den Werten anderer Variablen. Beispielsweise muss möglicherweise eine Probe mit einer hohen Konzentration einer Verbindung zur Analyse verdünnt werden, was zu einem proportionalen Aufpumpen der Zensurgrenzwerte für alle …

4
Was sind die korrekten Werte für Präzision und Rückruf in Randfällen?
Präzision ist definiert als: p = true positives / (true positives + false positives) Ist es richtig, dass sich die Genauigkeit 1 nähert true positivesund false positivessich 0 nähert? Gleiche Frage zum Rückruf: r = true positives / (true positives + false negatives) Ich führe derzeit einen statistischen Test durch, …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

1
Was ist "Zielgerichtete maximale Wahrscheinlichkeitserwartung"?
Ich versuche einige Artikel von Mark van der Laan zu verstehen. Er ist ein theoretischer Statistiker in Berkeley, der an Problemen arbeitet, die sich erheblich mit maschinellem Lernen überschneiden. Ein Problem für mich (neben der tiefen Mathematik) ist, dass er häufig bekannte Ansätze des maschinellen Lernens mit einer völlig anderen …

5
Was genau sind zensierte Daten?
Ich habe verschiedene Beschreibungen von zensierten Daten gelesen: A) Wie in diesem Thread erläutert , werden nicht quantifizierte Daten unterhalb oder oberhalb eines bestimmten Schwellenwerts zensiert. Nicht quantifiziert bedeutet, dass die Daten einen bestimmten Schwellenwert überschreiten oder unterschreiten, der genaue Wert ist uns jedoch nicht bekannt. Die Daten werden dann …

2
Laymans Erklärung der Zensur in der Überlebensanalyse
Ich habe gelesen, was Zensur ist und wie sie in der Überlebensanalyse berücksichtigt werden muss, aber ich würde gerne eine weniger mathematische Definition und eine intuitivere Definition hören (Bilder wären toll!). Kann mir jemand eine Erklärung zu 1) Zensur und 2) Auswirkungen wie Kaplan-Meier-Kurven und Cox-Regression geben?



1
Verwendung von Standardwerkzeugen für maschinelles Lernen für linkszensierte Daten
Ich entwickle eine Prognoseanwendung, deren Zweck es einem Importeur ist, die Nachfrage nach seinen Produkten über sein Kundennetzwerk von Händlern zu prognostizieren. Die Verkaufszahlen sind ein ziemlich guter Indikator für die Nachfrage, solange genügend Lagerbestände vorhanden sind, um die Nachfrage zu befriedigen. Wenn der Lagerbestand jedoch auf Null gesenkt wird …

2
Zensieren / Abschneiden in JAGS
Ich habe eine Frage, wie man ein Zensurproblem in JAGS einfügt. Ich beobachte eine bivariate Normalnormalmischung, bei der die X-Werte einen Messfehler aufweisen. Ich möchte das wahre zugrunde liegende "Mittel" der beobachteten zensierten Werte modellieren. ⌈xtrue+ϵ⌉=xobserved ϵ∼N(0,sd=.5)⌈xtrue+ϵ⌉=xobserved ϵ∼N(0,sd=.5)\begin{align*} \lceil x_{true}+\epsilon \rceil = x_{observed} \ \epsilon \sim N(0,sd=.5) \end{align*} Folgendes habe …

3
Rechte Zensur und linke Zensur
Wikipedia gibt folgende Definitionen: Richtige Zensur : Ein Datenpunkt liegt über einem bestimmten Wert, aber es ist nicht bekannt, um wie viel. Linke Zensur : Ein Datenpunkt liegt unter einem bestimmten Wert, aber es ist nicht bekannt, um wie viel. Was ist in diesen Definitionen gemeint mit: "Datenpunkt" "bestimmter Wert" …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.