Statistiken und Big Data survival

8

Generieren Sie eine Zufallsvariable mit einer definierten Korrelation zu einer oder mehreren vorhandenen Variablen.

Für eine Simulationsstudie muss ich Zufallsvariablen generieren, die eine vorab festgelegte (Populations-) Korrelation zu einer vorhandenen Variablen .Y.YY Ich sah in die RPakete copulaund CDVineder Zufall multivariate Verteilungen mit einer bestimmten Abhängigkeitsstruktur erzeugen kann. Es ist jedoch nicht möglich, eine der resultierenden Variablen an eine vorhandene Variable zu binden. Anregungen …

71 r correlation random-variable random-generation independence assumptions random-variable unbiased-estimator regression hypothesis-testing heteroscedasticity generalized-least-squares distributions networks data-visualization sas reproducible-research philosophical time-series variance outliers quality-control mean multilevel-analysis average weighted-mean regression confidence-interval prediction-interval correlation matlab matrix data-mining maximum-likelihood r time-series survival predictive-models

8

Wie kann man die Ausfallwahrscheinlichkeit ermitteln, wenn keine Fehler aufgetreten sind?

Ich habe mich gefragt, ob es eine Möglichkeit gibt, die Wahrscheinlichkeit eines Ausfalls (eines Produkts) zu ermitteln, wenn wir 1 Jahr lang 100.000 Produkte auf dem Markt haben und keine Ausfälle haben. Wie hoch ist die Wahrscheinlichkeit, dass eines der nächsten 10.000 verkauften Produkte versagt?

50 probability survival binomial

7

Überlebensanalyse-Tools in Python [geschlossen]

Ich frage mich, ob es Pakete für Python gibt, die Überlebensanalysen durchführen können. Ich habe das Überlebenspaket in R verwendet, möchte aber meine Arbeit auf Python portieren.

46 survival python

5

Vorhersage in der Cox-Regression

Ich mache eine multivariate Cox-Regression, ich habe meine signifikanten unabhängigen Variablen und Beta-Werte. Das Modell passt sehr gut zu meinen Daten. Jetzt möchte ich mein Modell verwenden und das Überleben einer neuen Beobachtung vorhersagen. Ich bin mir nicht sicher, wie ich das mit einem Cox-Modell machen soll. Bei einer linearen …

38 regression survival prediction cox-model

10

Warum wird angenommen, dass die Überlebenszeiten exponentiell verteilt sind?

Ich lerne die Überlebensanalyse aus diesem Beitrag über UCLA IDRE und bin in Abschnitt 1.2.1 aufgefallen . Das Tutorial sagt: ... wenn bekannt ist, dass die Überlebenszeiten exponentiell verteilt sind , dann die Wahrscheinlichkeit, eine Überlebenszeit zu beobachten ... Warum wird angenommen, dass die Überlebenszeiten exponentiell verteilt sind? Es erscheint …

36 distributions survival assumptions exponential

14

Referenzen für die Überlebensanalyse

Ich suche ein gutes Buch / Tutorial, um mehr über die Überlebensanalyse zu erfahren. Ich bin auch an Referenzen zur Durchführung von Überlebensanalysen in R interessiert.

33 r survival references

3

Welcher Verteilung folgen meine Daten?

Angenommen, ich habe 1000 Komponenten und habe Daten darüber gesammelt, wie oft ein Fehler protokolliert wurde. Jedes Mal, wenn ein Fehler protokolliert wurde, verfolge ich auch, wie lange mein Team zur Behebung des Problems gebraucht hat. Kurz gesagt, ich habe die Reparaturzeit (in Sekunden) für jede dieser 1000 Komponenten aufgezeichnet. …

31 distributions data-visualization survival reliability distribution-identification

5

Umgang mit hierarchischen / verschachtelten Daten beim maschinellen Lernen

Ich werde mein Problem mit einem Beispiel erklären. Angenommen, Sie möchten das Einkommen einer Person anhand einiger Attribute vorhersagen: {Alter, Geschlecht, Land, Region, Stadt}. Sie haben einen Trainingsdatensatz wie diesen train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

1

Können Freiheitsgrade eine nicht ganzzahlige Zahl sein?

Wenn ich GAM verwende, erhalte ich einen DF-Rest von (letzte Zeile im Code). Was bedeutet das? Über das GAM-Beispiel hinausgehend: Kann die Anzahl der Freiheitsgrade im Allgemeinen eine nicht ganzzahlige Zahl sein?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …

27 r degrees-of-freedom gam machine-learning pca lasso probability self-study bootstrap expected-value regression machine-learning linear-model probability simulation random-generation machine-learning distributions svm libsvm classification pca multivariate-analysis feature-selection archaeology r regression dataset simulation r regression time-series forecasting predictive-models r mean sem lavaan machine-learning regularization regression conv-neural-network convolution classification deep-learning conv-neural-network regression categorical-data econometrics r confirmatory-factor scale-invariance self-study unbiased-estimator mse regression residuals sampling random-variable sample probability random-variable convergence r survival weibull references autocorrelation hypothesis-testing distributions correlation regression statistical-significance regression-coefficients univariate categorical-data chi-squared regression machine-learning multiple-regression categorical-data linear-model pca factor-analysis factor-rotation classification scikit-learn logistic p-value regression panel-data multilevel-analysis variance bootstrap bias probability r distributions interquartile time-series hypothesis-testing normal-distribution normality-assumption kurtosis arima panel-data stata clustered-standard-errors machine-learning optimization lasso multivariate-analysis ancova machine-learning cross-validation

2

Warum verwenden wir in der Überlebensanalyse semiparametrische Modelle (Cox-proportionale Gefahren) anstelle von vollständig parametrischen Modellen?

Diese Frage wurde von Mathematics Stack Exchange migriert, da sie auf Cross Validated beantwortet werden kann. Vor 6 Jahren migriert . Ich habe das Cox Proportional Hazards-Modell untersucht, und diese Frage wird in den meisten Texten übersehen. Cox schlug vor, die Koeffizienten der Hazard-Funktion mithilfe einer Partial-Likelihood-Methode anzupassen, aber warum …

24 survival cox-model

2

Bayesian Survival Analysis: Bitte schreiben Sie mir einen Prior für Kaplan Meier!

Betrachten Sie rechtszensierte Beobachtungen mit Ereignissen zu den Zeitpunkten . Die Anzahl der anfälligen Personen zum Zeitpunkt ist und die Anzahl der Ereignisse zum Zeitpunkt ist .i n i i d it1, t2, …t1,t2,…t_1, t_2, \dotsichiinichnin_iichiidichdid_i Der Kaplan-Meier- oder Produktschätzer entsteht natürlich als MLE, wenn die Überlebensfunktion eine Sprungfunktion . …

20 bayesian survival kaplan-meier

4

Was sind die korrekten Werte für Präzision und Rückruf in Randfällen?

Präzision ist definiert als: p = true positives / (true positives + false positives) Ist es richtig, dass sich die Genauigkeit 1 nähert true positivesund false positivessich 0 nähert? Gleiche Frage zum Rückruf: r = true positives / (true positives + false negatives) Ich führe derzeit einen statistischen Test durch, …

20 precision-recall data-visualization logarithm references r networks data-visualization standard-deviation probability binomial negative-binomial r categorical-data aggregation plyr survival python regression r t-test bayesian logistic data-transformation confidence-interval t-test interpretation distributions data-visualization pca genetics r finance maximum probability standard-deviation probability r information-theory references computational-statistics computing references engineering-statistics t-test hypothesis-testing independence definition r censoring negative-binomial poisson-distribution variance mixed-model correlation intraclass-correlation aggregation interpretation effect-size hypothesis-testing goodness-of-fit normality-assumption small-sample distributions regression normality-assumption t-test anova confidence-interval z-statistic finance hypothesis-testing mean model-selection information-geometry bayesian frequentist terminology type-i-and-ii-errors cross-validation smoothing splines data-transformation normality-assumption variance-stabilizing r spss stata python correlation logistic logit link-function regression predictor pca factor-analysis r bayesian maximum-likelihood mcmc conditional-probability statistical-significance chi-squared proportion estimation error shrinkage application steins-phenomenon

4

Überlebensanalyse: kontinuierlich gegen diskrete Zeit

Ich bin verwirrt darüber, wie ich entscheiden soll, ob die Zeit in der Überlebensanalyse als kontinuierlich oder diskret behandelt wird. Konkret möchte ich die Überlebensanalyse verwenden, um Variablen auf Kinder- und Haushaltsebene zu identifizieren, deren Einfluss auf das Überleben von Jungen und Mädchen (bis zum Alter von 5 Jahren) am …

20 survival ties

2

Was ist der "

Was ist der Wert, der in der Zusammenfassung eines Coxph-Modells in R angegeben ist? Beispielsweise,R2R2R^2 Rsquare= 0.186 (max possible= 0.991 ) Ich habe dummerweise ein Manuskript als Wert hinzugefügt, und der Prüfer hat darauf hingewiesen, dass ihm kein Analogon der Statistik aus der für das Cox-Modell entwickelten klassischen linearen Regression …

18 r survival r-squared cox-model

3

Zurechnung vor oder nach der Aufteilung in Zug und Test?

Ich habe einen Datensatz mit N ~ 5000 und ungefähr 1/2, der auf mindestens einer wichtigen Variablen fehlt. Die Hauptanalysemethode sind Cox-proportionale Gefahren. Ich plane mehrere Anrechnungen. Ich werde mich auch in einen Zug und ein Test-Set aufteilen. Sollte ich die Daten aufteilen und dann separat unterstellen oder unterstellen und …

18 cross-validation survival multiple-imputation train

Als «survival» getaggte Fragen