Als «r» getaggte Fragen

Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.

1
Saisonbereinigung der Zähldaten
Ich habe stl () in R verwendet, um die Zähldaten in Trend-, saisonale und unregelmäßige Komponenten zu zerlegen. Die resultierenden Trendwerte sind keine ganzen Zahlen mehr. Ich habe folgende Fragen: Ist stl () eine geeignete Methode, um die Saison für Zählungsdaten zu entziehen? Kann ich lm () verwenden, um die …

1
Wie berechnet man „Wege zum Weißen Haus“ mit R?
Ich bin gerade auf diese großartige Analyse gestoßen, die sowohl interessant als auch optisch schön ist: http://www.nytimes.com/interactive/2012/11/02/us/politics/paths-to-the-white-house.html Ich bin gespannt, wie ein solcher "Pfadbaum" mit R erstellt werden kann. Welche Daten und Algorithmen braucht man, um einen solchen Pfadbaum zu erstellen? Vielen Dank.


1
Lineare Regression mit wiederholten Messungen in R
Ich konnte nicht herausfinden, wie eine lineare Regression in R in für ein Design mit wiederholten Kennzahlen durchgeführt werden kann. In einer früheren Frage (die noch nicht beantwortet wurde) wurde mir vorgeschlagen, keine lmgemischten Modelle zu verwenden , sondern diese zu verwenden. Ich habe es lmfolgendermaßen benutzt: lm.velocity_vs_Velocity_response <- lm(Velocity_response~Velocity*Subject, …


1
Warum liefern Eigen- und Svd-Zerlegungen einer Kovarianzmatrix, die auf spärlichen Daten basieren, unterschiedliche Ergebnisse?
Ich versuche, eine Kovarianzmatrix zu zerlegen, die auf einem dünn besetzten Datensatz basiert. Ich bemerke, dass die Summe von Lambda (erklärte Varianz), wie sie mit berechnet svdwird, mit zunehmend unsteten Daten verstärkt wird. Ohne Lücken, svdund eigendie gleichen Ergebnisse yeild. Dies scheint bei einer eigenZersetzung nicht zu passieren . Ich …
12 r  svd  eigenvalues 

2
randomForest wählt Regression statt Klassifikation
Ich verwende das randomForest- Paket in R und verwende die Iris-Daten. Die generierte zufällige Gesamtstruktur ist eine Klassifizierung. Wenn ich jedoch einen Datensatz mit ca. 700 Features verwende (die Features sind jeweils Pixel in einem 28 x 28 Pixel großen Bild), wird die Beschriftungsspalte benannt labelist die randomForesterzeugte Regression. Ich …
12 r  random-forest 

4
Differenzzeitreihen vor Arima oder innerhalb von Arima
Ist es besser, eine Reihe zu unterscheiden (vorausgesetzt, sie wird benötigt), bevor ein Arima verwendet wird, ODER besser, den Parameter d in Arima zu verwenden? Ich war überrascht, wie unterschiedlich die angepassten Werte sind, je nachdem, welche Route mit demselben Modell und denselben Daten gefahren wird. Oder mache ich etwas …
12 r  time-series  arima 


1
Wie kann ich die Recheneffizienz optimieren, wenn ich ein komplexes Modell wiederholt an einen großen Datensatz anpasse?
Ich habe Leistungsprobleme mit dem MCMCglmmPaket in R, um ein Modell mit gemischten Effekten auszuführen. Der Code sieht folgendermaßen aus: MC1<-MCMCglmm(bull~1,random=~school,data=dt,family="categorical" , prior=list(R=list(V=1,fix=1), G=list(G1=list(V=1, nu=0))) , slice=T, nitt=iter, ,burnin=burn, verbose=F) Die Daten enthalten rund 20.000 Beobachtungen, die in rund 200 Schulen zusammengefasst sind. Ich habe alle nicht verwendeten Variablen aus …

2
Wie werden Funktionsdaten simuliert?
Ich versuche verschiedene Ansätze zur Funktionsdatenanalyse zu testen. Idealerweise möchte ich das Panel meiner Ansätze an simulierten Funktionsdaten testen. Ich habe versucht, eine simulierte FD mithilfe eines Ansatzes zu generieren, der auf einer Summierung von Gaußschen Rauschen basiert (Code unten), aber die resultierenden Kurven sehen im Vergleich zur Realität viel …

2
Wahrscheinlichkeitsverteilung bei gegebenem Datensatz automatisch bestimmen
Gegeben ein Datensatz: x <- c(4.9958942,5.9730174,9.8642732,11.5609671,10.1178216,6.6279774,9.2441754,9.9419299,13.4710469,6.0601435,8.2095239,7.9456672,12.7039825,7.4197810,9.5928275,8.2267352,2.8314614,11.5653497,6.0828073,11.3926117,10.5403929,14.9751607,11.7647580,8.2867261,10.0291522,7.7132033,6.3337642,14.6066222,11.3436587,11.2717791,10.8818323,8.0320657,6.7354041,9.1871676,13.4381778,7.4353197,8.9210043,10.2010750,11.9442048,11.0081195,4.3369520,13.2562675,15.9945674,8.7528248,14.4948086,14.3577443,6.7438382,9.1434984,15.4599419,13.1424011,7.0481925,7.4823108,10.5743730,6.4166006,11.8225244,8.9388744,10.3698150,10.3965596,13.5226492,16.0069239,6.1139247,11.0838351,9.1659242,7.9896031,10.7282936,14.2666492,13.6478802,10.6248561,15.3834373,11.5096033,14.5806570,10.7648690,5.3407430,7.7535042,7.1942866,9.8867927,12.7413156,10.8127809,8.1726772,8.3965665) .. Ich möchte die am besten passende Wahrscheinlichkeitsverteilung (Gamma, Beta, Normal, Exponentiell, Poisson, Chi-Quadrat usw.) mit einer Schätzung der Parameter bestimmen. Die Frage auf dem folgenden Link, wo eine Lösung mit R bereitgestellt wird, ist mir bereits bekannt: /programming/2661402/given-a-set-of-random-numbers-drawn-from-a- kontinuierliche-univariate-verteilung-f die beste vorgeschlagene lösung …

1
Wie kann man mit rjags Vorhersagen erstellen?
Ich habe rjags verwendet, um MCMC auf einem Modell auszuführen, das in der JAGS-Sprache angegeben ist. Gibt es eine gute Möglichkeit, dieses Modell zu extrahieren und Vorhersagen damit durchzuführen (unter Verwendung der posterioren Verteilungen meiner Parameter)? Ich kann das Modell in R neu spezifizieren und die Modi meiner Parameter posteriors …
12 r  jags 

1
Unterschiede zwischen PROC Mixed und lme / lmer in R - Freiheitsgraden
Hinweis: Diese Frage ist ein Repost, da meine vorherige Frage aus rechtlichen Gründen gelöscht werden musste. Beim Vergleich von PROC MIXED von SAS mit der Funktion lmeaus dem nlmePaket in R bin ich auf einige verwirrende Unterschiede gestoßen. Insbesondere unterscheiden sich die Freiheitsgrade in den verschiedenen Tests zwischen PROC MIXEDund …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 


Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.