Als «r» getaggte Fragen

Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.


4
Zufällige Gesamtstrukturberechnungszeit in R
Ich verwende das Party- Paket in R mit 10.000 Zeilen und 34 Features, und einige Factor-Features haben mehr als 300 Levels. Die Rechenzeit ist zu lang. (Es hat bis jetzt 3 Stunden gedauert und ist noch nicht fertig.) Ich möchte wissen, welche Elemente einen großen Einfluss auf die Rechenzeit einer …
48 r  random-forest 

1
Wie wende ich Standardisierung / Normalisierung auf Trainings- und Testsets an, wenn Vorhersage das Ziel ist?
Wandle ich alle meine Daten oder Falze (wenn der Lebenslauf angewendet wird) gleichzeitig um? z.B (allData - mean(allData)) / sd(allData) Wandle ich Zugset und Testset getrennt um? z.B (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Oder transformiere ich Triebzüge und verwende Berechnungen auf dem Testsatz? z.B (trainData …

7
Wo fange ich mit Statistiken für einen erfahrenen Entwickler an?
In der ersten Jahreshälfte 2015 habe ich den Coursera-Kurs für maschinelles Lernen (von Andrew Ng, GREAT-Kurs) absolviert. Und lernte die Grundlagen des maschinellen Lernens (lineare Regression, logistische Regression, SVM, Neuronale Netze ...) Außerdem bin ich seit 10 Jahren Entwickler, sodass das Erlernen einer neuen Programmiersprache kein Problem darstellt. In letzter …


4
Wie wird die Auswahl der logistischen Regressionsuntermenge durchgeführt?
Ich passe eine Binomialfamilie glm in R an, und ich habe eine ganze Truppe von erklärenden Variablen, und ich muss das Beste finden (R-Quadrat als Maß ist in Ordnung). Kurz bevor ich ein Skript schreibe, um zufällig verschiedene Kombinationen der erklärenden Variablen durchzugehen und dann aufzuzeichnen, was am besten funktioniert, …
47 r  logistic 



5
Wie berechnet man Pseudo-
Christopher Mannings Artikel über die logistische Regression in R zeigt eine logistische Regression in R wie folgt: ced.logr <- glm(ced.del ~ cat + follows + factor(class), family=binomial) Einige Ausgaben: > summary(ced.logr) Call: glm(formula = ced.del ~ cat + follows + factor(class), family = binomial("logit")) Deviance Residuals: Min 1Q Median 3Q …

3
Interpretation des log transformierten Prädiktors und / oder der Antwort
Ich frage mich, ob es einen Unterschied in der Interpretation macht, ob nur die abhängigen, sowohl die abhängigen als auch die unabhängigen Variablen oder nur die unabhängigen Variablen log-transformiert werden. Betrachten Sie den Fall von log(DV) = Intercept + B1*IV + Error Ich kann die IV als prozentuale Erhöhung interpretieren, …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

2
Wie werden künstliche Daten für die logistische Regression simuliert?
Ich weiß, dass ich etwas in meinem Verständnis der logistischen Regression vermisse und würde mich über jede Hilfe sehr freuen. Nach meinem Verständnis geht die logistische Regression davon aus, dass die Wahrscheinlichkeit eines 1-Ergebnisses bei den Eingaben eine lineare Kombination der Eingaben ist, die durch eine inverse logistische Funktion geleitet …

5
R online nutzen - ohne es zu installieren [closed]
Gibt es eine Möglichkeit, R in einem Webinterface zu verwenden, ohne es installieren zu müssen? Ich habe nur ein kleines Skript, das ich gerne ausführe, aber ich möchte es nur ohne langen Installationsvorgang ausprobieren. Danke.
45 r 

3
Was ist Abweichung? (speziell im WARENKORB / Teil)
Was ist "Abweichung", wie wird sie berechnet und wie werden sie in verschiedenen Bereichen der Statistik verwendet? Insbesondere interessiere ich mich persönlich für die Verwendung in CART (und die Implementierung in rpart in R). Ich frage dies, da der Wiki-Artikel etwas zu wünschen übrig lässt und Ihre Einsichten sehr willkommen …
45 r  cart  rpart  deviance 


1
Wie sind ANOVA und MANOVA vom Typ I, Typ II und Typ III zu interpretieren?
Meine Hauptfrage ist, wie die Ausgabe (Koeffizienten, F, P) bei der Durchführung einer (sequentiellen) ANOVA vom Typ I zu interpretieren ist. Mein spezielles Forschungsproblem ist etwas komplexer, deshalb werde ich mein Beispiel in Teile zerlegen. Wenn ich mich zuerst für die Auswirkung der Spinnendichte (X1) auf das Pflanzenwachstum (Y1) interessiere …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.