Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.
Es ist hilfreich, den Datenanalysecode von Experten zu studieren. Ich habe kürzlich Github durchgesehen und es gibt eine Reihe von Leuten, die dort Datenanalyse-Code austauschen . Dies beinhaltet einige R-Pakete (die natürlich direkt von CRAN erhältlich sind), aber auch einige Beispiele reproduzierbarer Forschung, insbesondere unter Verwendung von R ( siehe …
Die meisten Standarddistributionen in R haben eine Befehlsfamilie - pdf / pmf, cdf / cmf, quantile, zufällige Abweichungen (zum Beispiel dnorm, pnorm, qnorm, rnorm). Ich weiß, es ist einfach genug, einige Standardbefehle zu verwenden, um diese Funktionen für die diskreten Gleichverteilungen zu reproduzieren, aber gibt es bereits eine bevorzugte integrierte …
Wenn Sie zurückdenken, bis zu dem Zeitpunkt, als Sie mit der Zeitreihenanalyse begonnen haben. Welche Tools, R-Pakete und Internetressourcen hätten Sie gerne gewusst? Was ich versuche zu fragen ist, wo soll man anfangen? Speziell, gibt es irgendwelche Ressourcen für R, die es für jemanden, der "neu" in der Zeitreihenanalyse mit …
Ich benutze das "boot" -Paket, um einen ungefähren 2-seitigen Bootstrap-P-Wert zu berechnen, aber das Ergebnis ist zu weit vom P-Wert entfernt, als dass man t.test verwenden könnte. Ich kann nicht herausfinden, was ich in meinem R-Code falsch gemacht habe. Kann mir bitte jemand einen Hinweis dazu geben time = c(14,18,11,13,18,17,21,9,16,17,14,15, …
Ich bin gerade auf diese Arbeit gestoßen , in der beschrieben wird, wie die Wiederholbarkeit (auch bekannt als Zuverlässigkeit, auch bekannt als Intraclass-Korrelation) einer Messung über Mixed-Effects-Modellierung berechnet wird. Der R-Code wäre: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = attr(vc,'sc')^2 intercept_var = …
Ich habe R-Skripte zum Lesen großer Mengen von CSV-Daten aus verschiedenen Dateien und führe dann maschinelle Lernaufgaben wie SVM zur Klassifizierung durch. Gibt es Bibliotheken für die Verwendung mehrerer Kerne auf dem Server für R. oder Was ist der geeignetste Weg, um dies zu erreichen?
Doppelter Thread: Ich habe gerade die neueste Version von R installiert. Welche Pakete sollte ich erhalten? Was sind die R- Pakete, die Sie sich bei Ihrer täglichen Arbeit mit Daten nicht vorstellen können? Bitte listen Sie sowohl allgemeine als auch spezifische Tools auf. UPDATE: Stand 24.10.10 ggplot2scheint der Gewinner mit …
Ich habe einen Datensatz mit 9 kontinuierlichen unabhängigen Variablen. Ich versuche, unter diesen Variablen auszuwählen, um ein Modell an eine einzelne prozentuale (abhängige) Variable anzupassen Score. Leider weiß ich, dass es ernsthafte Kollinearität zwischen mehreren Variablen geben wird. Ich habe versucht, die stepAIC()Funktion in R für die Variablenauswahl zu verwenden, …
Ich habe eine Matrix, in der a (i, j) angibt, wie oft ich Seite j angesehen habe. Es gibt 27.000 Einzelpersonen und 95.000 Seiten. Ich möchte eine Handvoll "Dimensionen" oder "Aspekte" im Bereich von Seiten haben, die Gruppen von Seiten entsprechen, die oft zusammen betrachtet werden. Mein letztendliches Ziel ist …
Wenn ich GAM verwende, erhalte ich einen DF-Rest von (letzte Zeile im Code). Was bedeutet das? Über das GAM-Beispiel hinausgehend: Kann die Anzahl der Freiheitsgrade im Allgemeinen eine nicht ganzzahlige Zahl sein?26.626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance Residuals: Min 1Q Median …
Ich habe eine Matrix von 336x256 Gleitkommazahlen (336 Bakteriengenome (Spalten) x 256 normalisierte Tetranukleotidfrequenzen (Zeilen), z. B. addiert sich jede Spalte zu 1). Ich erhalte gute Ergebnisse, wenn ich meine Analyse mit der Hauptkomponentenanalyse durchführe. Zuerst berechne ich die kmeans-Cluster anhand der Daten, führe dann eine PCA durch und färbe …
arimaWas bedeutet in der Funktion in R order(1, 0, 12)? Was sind die Werte, die zugeordnet werden können p, d, q, und was der Prozess , diese Werte zu finden ist?
Ich denke über die Diskussion um diese Frage und insbesondere über Frank Harrells Kommentar nach, dass die Varianzschätzung in einem reduzierten Modell (dh einer, aus der eine Reihe von erklärenden Variablen getestet und verworfen wurden) Yes allgemeine Freiheitsgrade verwenden sollte . Professor Harrell weist darauf hin, dass dies den verbleibenden …
Welche praktischen und interpretationsbezogenen Auswirkungen hat das Schätzen in einem mehrstufigen Modell im Vergleich zum Nichtschätzen von Korrelationsparametern für zufällige Effekte? Der praktische Grund, dies zu erfragen, ist, dass es im früheren Framework in R keine implementierte Methode zum Schätzen von p-Werten über MCMC-Techniken gibt, wenn Schätzungen im Modell der …
Da der allgemeine Konsens darin zu bestehen scheint, gemischte Modelle über lmer()in R anstelle der klassischen ANOVA zu verwenden (aus den häufig genannten Gründen, wie unsymmetrische Designs, gekreuzte Zufallseffekte usw.), möchte ich es mit meinen Daten versuchen. Ich befürchte jedoch, dass ich diesen Ansatz meinem Vorgesetzten (der am Ende eine …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.