Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.
Nach dem Lesen diesen Blog-Beitrag über Bayes'sche strukturelle Zeitreihenmodelle , wollte ich die Implementierung im Kontext eines Problems betrachten, für das ich zuvor ARIMA verwendet hatte. Ich habe einige Daten mit einigen bekannten (aber lauten) saisonalen Komponenten - es gibt definitiv jährliche, monatliche und wöchentliche Komponenten dazu und auch einige …
Ich habe ein funktionierendes Beispiel (in R), das ich weiter zu verstehen versuche. Ich benutze Limma, um ein lineares Modell zu erstellen, und versuche zu verstehen, was in den Fold Change-Berechnungen Schritt für Schritt vor sich geht. Ich versuche hauptsächlich herauszufinden, was passiert, um die Koeffizienten zu berechnen. Nach allem, …
Ich würde gerne wissen, ob Breimans zufälliger Wald (zufälliger Wald in R randomForest-Paket) als Aufteilungskriterium (Kriterium für die Attributauswahl) Informationsgewinn oder Gini-Index verwendet. Ich habe versucht, es auf http://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm und in der Dokumentation für das randomForest-Paket in R herauszufinden. Aber das einzige, was ich gefunden habe, ist, dass der Gini-Index …
Ich habe zwei Variablen - X und Y und ich muss den Cluster maximal (und optimal) = 5 machen. Der ideale Plot von Variablen sieht folgendermaßen aus: Ich würde gerne 5 Cluster daraus machen. Etwas wie das: Daher denke ich, dass dies ein Mischungsmodell mit 5 Clustern ist. Jeder Cluster …
Ich habe versucht, den AIC einer linearen Regression in R zu berechnen, ohne die AICFunktion zu verwenden: lm_mtcars <- lm(mpg ~ drat, mtcars) nrow(mtcars)*(log((sum(lm_mtcars$residuals^2)/nrow(mtcars))))+(length(lm_mtcars$coefficients)*2) [1] 97.98786 Allerdings AICgibt einen anderen Wert: AIC(lm_mtcars) [1] 190.7999 Kann mir jemand sagen, was ich falsch mache?
Permutationstests (auch Randomisierungstest, Re-Randomisierungstest oder exakter Test genannt) sind sehr nützlich und nützlich, wenn die zum Beispiel erforderliche Annahme einer Normalverteilung t-testnicht erfüllt ist und wenn die Transformation der Werte durch Rangfolge der Werte erfolgt Ein nicht parametrischer Test Mann-Whitney-U-testwürde dazu führen, dass mehr Informationen verloren gehen. Eine einzige Annahme, …
Ich bin neu im glmnetPaket und bin mir noch nicht sicher, wie ich die Ergebnisse interpretieren soll. Könnte mir bitte jemand beim Lesen des folgenden Traceplots helfen? Das Diagramm wurde erhalten, indem Folgendes ausgeführt wurde: library(glmnet) return <- matrix(ret.ff.zoo[which(index(ret.ff.zoo)==beta.df$date[2]), ]) data <- matrix(unlist(beta.df[which(beta.df$date==beta.df$date[2]), ][ ,-1]), ncol=num.factors) model <- cv.glmnet(data, return, …
Ich habe einige Daten, die zwischen 0 und 1 begrenzt sind. Ich habe das betaregPaket in R verwendet, um ein Regressionsmodell mit den begrenzten Daten als abhängige Variable anzupassen. Meine Frage ist: Wie interpretiere ich die Koeffizienten aus der Regression?
Ich habe die Sample-Kovarianzmatrix eines Samples geschätzt und eine symmetrische Matrix erhalten. Mit , würde Ich mag schaffen -variate normalverteilt rn aber deshalb muss ich die Cholesky - Zerlegung von . Was soll ich tun, wenn nicht eindeutig ist?C n C CCCCCCCnnnCCCCCC
Ich verwende eine tägliche Zeitreihe von Verkaufsdaten, die etwa 2 Jahre tägliche Datenpunkte enthält. Anhand einiger Online-Tutorials / Beispiele habe ich versucht, die Saisonalität in den Daten zu identifizieren. Es scheint eine wöchentliche, monatliche und wahrscheinlich jährliche Periodizität / Saisonalität zu geben. Beispielsweise gibt es Zahltage, insbesondere am ersten Zahltag …
Das R-Plot-Paket ggplot2 verfügt über eine großartige Funktion namens stat_smooth zum Plotten einer Regressionslinie (oder -kurve ) mit dem zugehörigen Konfidenzband. Es fällt mir jedoch schwer, genau herauszufinden, wie dieses Konfidenzband für jede Zeit der Regressionsgeraden (oder "Methode") erzeugt wird. Wie finde ich diese Informationen?
Ich habe eine Datenbank von Ereignissen (dh eine Variable von Daten) und zugehörigen Kovariaten. Die Ereignisse werden durch den nicht stationären Poisson-Prozess erzeugt, wobei Parameter eine unbekannte (aber möglicherweise lineare) Funktion einiger Kovariaten sind. Ich denke, das NHPoisson-Paket gibt es nur für diesen Zweck; aber nach 15 stunden erfolgloser recherche …
Ich benutze das gbm-Paket zur Klassifizierung. Wie erwartet ist das Ergebnis gut. Aber ich versuche die Ausgabe des Klassifikators zu verstehen. Die Ausgabe enthält fünf Begriffe. `Iter TrainDeviance ValidDeviance StepSize Improve` Könnte jemand die Bedeutung jeden Begriff, vor allem die Bedeutung erklärt zu verbessern .
Eines der Probleme, die ich bei gemischten Modellen immer hatte, ist das Herausfinden von Datenvisualisierungen, wie sie auf einem Papier oder Poster landen können, sobald die Ergebnisse vorliegen. Im Moment arbeite ich an einem Poisson-Mischeffektmodell mit einer Formel, die ungefähr so aussieht: a <- glmer(counts ~ X + Y + …
Ich mache einen Abschlusskurs in Angewandter Statistik, der das folgende Lehrbuch verwendet (um Ihnen ein Gefühl für das Niveau des behandelten Materials zu vermitteln): Statistische Konzepte und Methoden , von GK Bhattacharyya und RA Johnson. Der Professor verlangt von uns, SAS für die Hausaufgaben zu verwenden. Meine Frage ist: Gibt …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.