Als «r» getaggte Fragen

Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.


1
R-Paket für Weighted Random Forest? Klassewt Option?
Ich versuche, Random Forest zu verwenden, um das Ergebnis eines extrem unausgeglichenen Datensatzes vorherzusagen (die Minderheitsklassenrate beträgt nur etwa 1% oder sogar weniger). Da der herkömmliche Random Forest-Algorithmus die Gesamtfehlerrate minimiert, anstatt den Minderheitsklassen besondere Aufmerksamkeit zu widmen, ist er nicht direkt auf unausgeglichene Daten anwendbar. Daher möchte ich die …
16 r  random-forest 


2
Was sind "Koeffizienten linearer Diskriminanten" in LDA?
In verwende Rich die ldaFunktion aus der Bibliothek, MASSum die Klassifizierung durchzuführen. Wie ich LDA verstehe, wird dem Eingang die Bezeichnung zugewiesen , die maximiert , richtig?xxxyyyp(y|x)p(y|x)p(y|x) Aber wenn ich das Modell , in das verstehe ich die Ausgabe von nicht ganz , x=(Lag1,Lag2)x=(Lag1,Lag2)x=(Lag1,Lag2)y= D i r e c t …


3
Verwenden des R-Vorhersagepakets mit fehlenden Werten und / oder unregelmäßigen Zeitreihen
Ich bin beeindruckt vom R- forecastPaket, sowie zB dem zooPaket für unregelmäßige Zeitreihen und Interpolation fehlender Werte. Meine Anwendung liegt im Bereich der Callcenter-Verkehrsprognose, daher fehlen (fast) immer Daten an den Wochenenden, die gut verarbeitet werden können zoo. Außerdem können einige diskrete Punkte fehlen, ich benutze einfach Rs NAdafür. Die …

2
PCA und k-fache Kreuzvalidierung in Caret-Packung in R
Ich habe mir gerade einen Vortrag aus dem Kurs über maschinelles Lernen auf Coursera noch einmal angesehen. In dem Abschnitt, in dem der Professor PCA für die Vorverarbeitung von Daten in beaufsichtigten Lernanwendungen bespricht, sagt er, dass PCA nur für die Trainingsdaten durchgeführt werden sollte und dann das Mapping verwendet …

5
Wie finde ich lokale Gipfel / Täler in einer Reihe von Daten?
Hier ist mein Experiment: Ich benutze die findPeaksFunktion im quantmod- Paket: Ich möchte "lokale" Peaks innerhalb einer Toleranz 5 erkennen, dh die ersten Stellen nach der Zeitreihe fallen um 5 von den lokalen Peaks ab: aa=100:1 bb=sin(aa/3) cc=aa*bb plot(cc, type="l") p=findPeaks(cc, 5) points(p, cc[p]) p Die Ausgabe ist [1] 3 …
16 r  time-series 

6
Rechengeschwindigkeit in R?
Ich wurde beauftragt, eines unserer aktuellen großen stochastischen Modelle aus SAS in eine neue Sprache zu überführen. Persönlich bevorzuge ich eine traditionell kompilierte Sprache, aber der PI möchte, dass ich R auschecke, das ich nie benutzt habe. Unsere Motivation, das Modell aus SAS herauszuholen, ist, dass (1) viele Menschen keinen …
16 r  computing 


2
Wie verwende ich die ordinale logistische Regression mit zufälligen Effekten?
In meiner Studie werde ich die Arbeitsbelastung mit verschiedenen Metriken messen. Mit Herzfrequenzvariabilität (HRV), elektrodermaler Aktivität (EDA) und subjektiver Skala (IWS). Nach der Normalisierung hat das IWS drei Werte: Arbeitsbelastung niedriger als normal Arbeitsbelastung ist durchschnittlich Die Arbeitsbelastung ist höher als normal. Ich möchte sehen, wie gut die physiologischen Maßnahmen …


1
Wie passt man ein gemischtes Modell mit einer Antwortvariablen zwischen 0 und 1 an?
Ich versuche, lme4::glmer()ein binomiales verallgemeinertes gemischtes Modell (GLMM) mit abhängiger Variable anzupassen, die nicht binär ist, sondern eine kontinuierliche Variable zwischen Null und Eins. Man kann sich diese Variable als Wahrscheinlichkeit vorstellen; Tatsächlich ist es die Wahrscheinlichkeit, die von menschlichen Probanden angegeben wurde (in einem Experiment, das ich bei der …

4
Die Maschinengenauigkeit zur Steigerung des Gradienten nimmt mit zunehmender Anzahl von Iterationen ab
Ich experimentiere mit dem Algorithmus der Gradientenverstärkungsmaschine über das caretPaket in R. Unter Verwendung eines kleinen Datensatzes für Hochschulzulassungen habe ich den folgenden Code ausgeführt: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting …
15 machine-learning  caret  boosting  gbm  hypothesis-testing  t-test  panel-data  psychometrics  intraclass-correlation  generalized-linear-model  categorical-data  binomial  model  intercept  causality  cross-correlation  distributions  ranks  p-value  z-test  sign-test  time-series  references  terminology  cross-correlation  definition  probability  distributions  beta-distribution  inverse-gamma  missing-data  paired-comparisons  paired-data  clustered-standard-errors  cluster-sample  time-series  arima  logistic  binary-data  odds-ratio  medicine  hypothesis-testing  wilcoxon-mann-whitney  unsupervised-learning  hierarchical-clustering  neural-networks  train  clustering  k-means  regression  ordinal-data  change-scores  machine-learning  experiment-design  roc  precision-recall  auc  stata  multilevel-analysis  regression  fitting  nonlinear  jmp  r  data-visualization  gam  gamm4  r  lme4-nlme  many-categories  regression  causality  instrumental-variables  endogeneity  controlling-for-a-variable 

1
Schreiben der mathematischen Gleichung für ein Modell mit gemischten Effekten auf mehreren Ebenen
Die Frage zum Lebenslauf Ich versuche, (eine) detaillierte und präzise mathematische Darstellung (en) eines gemischten Effektmodells zu geben. Ich verwende das lme4Paket in R. Was ist die richtige mathematische Darstellung für mein Modell? Die Daten, die wissenschaftliche Frage und der R-Code Mein Datensatz besteht aus Arten in verschiedenen Regionen. Ich …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.