Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.
Ich bin sehr neu in Bezug auf R und Statistiken im Allgemeinen, aber ich muss ein Streudiagramm erstellen, von dem ich denke, dass es über seine ursprünglichen Kapazitäten hinausgeht. Ich habe ein paar Vektoren von Beobachtungen und möchte mit ihnen ein Streudiagramm erstellen, und jedes Paar fällt in eine von …
Ich bin mit R, suchte ich auf Google und erfuhr , dass kpss.test(), PP.test()und adf.test()verwendet werden , um Stationarität der Zeitreihe zu kennen. Aber ich bin kein Statistiker, der seine Ergebnisse interpretieren kann > PP.test(x) Phillips-Perron Unit Root Test data: x Dickey-Fuller = -30.649, Truncation lag parameter = 7, p-value …
Ich versuche, mit R auf dem neuesten Stand zu sein. Ich möchte schließlich R-Bibliotheken für die Textklassifizierung verwenden. Ich habe mich nur gefragt, welche Erfahrungen die Leute mit der Skalierbarkeit von R machen, wenn es um die Klassifizierung von Texten geht. Es ist wahrscheinlich, dass ich auf hochdimensionale Daten stoße …
Ich versuche, die Anzahl der Aktionen von Benutzern (in diesem Fall "Gefällt mir") im Laufe der Zeit grafisch darzustellen. Ich habe also "Anzahl der Aktionen" als meine y-Achse, meine x-Achse ist die Zeit (Wochen) und jede Zeile repräsentiert einen Benutzer. Mein Problem ist, dass ich diese Daten für einen Satz …
Ich bin auf dieses nette Tutorial gestoßen: Ein Handbuch für statistische Analysen mit R. Kapitel 13. Hauptkomponentenanalyse: Der olympische Siebenkampf zur Durchführung von PCA in R-Sprache. Ich verstehe die Interpretation von Abbildung 13.3 nicht: Ich zeichne also den ersten Eigenvektor gegen den zweiten Eigenvektor. Was bedeutet das? Angenommen, der dem …
Welchen Unterschied macht die Zentrierung (oder die Aufhebung der Bedeutung) Ihrer Daten für PCA? Ich habe gehört, dass dies die Mathematik erleichtert oder verhindert, dass der erste PC von den Variablen dominiert wird, aber ich habe das Gefühl, dass ich das Konzept noch nicht richtig verstanden habe. Zum Beispiel die …
Ich versuche, Varianzinflationsfaktoren mithilfe der vifFunktion im R-Paket zu interpretieren car. Die Funktion druckt sowohl eine verallgemeinerte und auch GVIF 1 / ( 2 ⋅ df ) . Laut der Hilfedatei dieser letztere WertVIFVIF\text{VIF}GVIF1/(2⋅df)GVIF1/(2⋅df)\text{GVIF}^{1/(2\cdot\text{df})} Um die Dimension des Vertrauensellipsoids anzupassen, gibt die Funktion auch GVIF ^ [1 / (2 * …
Ich hatte eine Frage zum Interaktionstiefenparameter in gbm in R. Dies mag eine Noob-Frage sein, für die ich mich entschuldige, aber wie zeigt der Parameter, von dem ich glaube, dass er die Anzahl der Endknoten in einem Baum angibt, im Grunde genommen X-way an Interaktion zwischen den Prädiktoren? Ich versuche …
Ich habe versucht, in verschiedenen Quellen nachzulesen, bin mir aber immer noch nicht sicher, welcher Test für meinen Fall geeignet wäre. Es gibt drei verschiedene Fragen, die ich zu meinem Datensatz stelle: Die Probanden werden zu verschiedenen Zeiten auf Infektionen mit X getestet. Ich möchte wissen, ob die Anteile von …
Kann mir jemand sagen, wie ich die Darstellungen "Residuen vs. angepasste", "normale q-q", "Skalenposition" und "Residuen vs. Hebel" interpretieren soll? Ich füge ein binomiales GLM ein, speichere es und zeichne es dann.
Ich werde mein Problem mit einem Beispiel erklären. Angenommen, Sie möchten das Einkommen einer Person anhand einiger Attribute vorhersagen: {Alter, Geschlecht, Land, Region, Stadt}. Sie haben einen Trainingsdatensatz wie diesen train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", "M","F","M","F", "F","F","F","M")), Income=c(31,42,71,65, 50,51,101,38, 47,50,55,23)) …
Wie werden Standardfehler berechnet, wenn Sie einen angepassten Wert aus einem logistischen Regressionsmodell vorhersagen? Ich meine für die angepassten Werte , nicht für die Koeffizienten (die Fishers Informationsmatrix beinhaltet). Ich habe nur herausgefunden, wie ich die Zahlen erhalten kann R(z. B. hier in r-help oder hier in Stack Overflow), aber …
Ich möchte GLM und Elastic Net verwenden, um die relevanten Features auszuwählen und ein lineares Regressionsmodell zu erstellen (dh sowohl Vorhersage als auch Verständnis, daher ist es besser, relativ wenige Parameter zu haben). Die Ausgabe erfolgt kontinuierlich. Es sind Gene pro Fälle. Ich habe über das Paket gelesen , bin …
Es scheint mir, dass nur zwei R-Pakete in der Lage sind, Latent Dirichlet Allocation durchzuführen : Einer ist lda, verfasst von Jonathan Chang; und die andere stammt topicmodelsvon Bettina Grün und Kurt Hornik. Was sind die Unterschiede zwischen diesen beiden Paketen in Bezug auf Leistung, Implementierungsdetails und Erweiterbarkeit?
Ich möchte den Unterschied in der Reaktion zweier Variablen auf einen Prädiktor testen. Hier ist ein minimal reproduzierbares Beispiel. library(nlme) ## gls is used in the application; lm would suffice for this example m.set <- gls(Sepal.Length ~ Petal.Width, data = iris, subset = Species == "setosa") m.vir <- gls(Sepal.Length ~ …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.