Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.
Ich bin sehr verwirrt darüber, wie Gewicht in glm mit family = "binomial" funktioniert. Nach meinem Verständnis wird die Wahrscheinlichkeit des glm mit family = "binomial" wie folgt angegeben: wobeiyder "Anteil des beobachteten Erfolgs" ist undndie bekannte Anzahl von Versuchen ist.f( y) = ( nn y) pny( 1 - p …
Ich arbeite an einem kleinen Projekt, bei dem wir versuchen, die Rohstoffpreise (Öl, Aluminium, Zinn usw.) für die nächsten 6 Monate vorherzusagen. Ich muss 12 solche Variablen vorhersagen und habe Daten von April 2008 bis Mai 2013. Wie gehe ich bei der Vorhersage vor? Ich habe folgendes gemacht: Importierte Daten …
Ich möchte einen Shapiro-Wilk-W-Test und einen Kolmogorov-Smirnov-Test mit den Residuen eines linearen Modells durchführen, um die Normalität zu überprüfen. Ich habe mich nur gefragt, welche Residuen dafür verwendet werden sollten - die rohen Residuen, die Pearson-Residuen, studentisierte Residuen oder standardisierte Residuen? Für einen Shapiro-Wilk-W-Test scheinen die Ergebnisse für die rohen …
In der Elementarstatistik habe ich gelernt, dass mit einem allgemeinen linearen Modell Beobachtungen unabhängig sein müssen, damit Schlussfolgerungen gültig sind. Wenn Clustering auftritt, kann die Unabhängigkeit möglicherweise nicht länger aufrecht erhalten werden, was zu ungültigen Schlussfolgerungen führt, sofern dies nicht berücksichtigt wird. Eine Möglichkeit, eine solche Clusterbildung zu berücksichtigen, besteht …
Ich habe ein logistisches Regressionsmodell (Via train) für eine binäre Antwort erhalten, und ich habe die logistische Verwirrungsmatrix über confusionMatrixin erhalten caret. Es gibt mir die logistische Modellverwirrungsmatrix, obwohl ich nicht sicher bin, welcher Schwellenwert verwendet wird, um es zu erhalten. Wie erhalte ich die Verwirrungsmatrix für bestimmte Schwellenwerte mit …
Ich habe Daten darüber, wie viele Benutzer wie viele Fragen posten. Beispielsweise, [UserCount, QuestionCount] [2, 100] [9, 10] [3, 80] ... ... Dies bedeutet, dass 2 Benutzer jeweils 100 Fragen, 9 Benutzer jeweils 10 Fragen usw. stellten. Wie kann ich also feststellen, ob die UserCount, QuestionCountVerteilung einem Potenzgesetz folgt? Ich …
Hintergrund Ich versuche, das erste Beispiel in einem Kurs zum Anpassen von Modellen zu verstehen (das mag lächerlich einfach erscheinen). Ich habe die Berechnungen von Hand durchgeführt und sie stimmen mit dem Beispiel überein, aber wenn ich sie in R wiederhole, sind die Modellkoeffizienten deaktiviert. Ich dachte, der Unterschied könnte …
Im Allgemeinen frage ich mich, ob es immer besser ist, keine orthogonalen Polynome zu verwenden, wenn eine Regression mit Variablen höherer Ordnung angepasst wird. Insbesondere frage ich mich mit der Verwendung von R: Wenn poly()mit raw = FALSEdie gleichen angepassten Werte liefert wie poly()mit raw = TRUEund polymit raw = …
Ich habe einen Datensatz mit der Annahme, dass die nächsten Nachbarn die besten Prädiktoren sind. Nur ein perfektes Beispiel für einen Zwei-Wege-Gradienten, der Angenommen, wir haben einen Fall, in dem nur wenige Werte fehlen, und wir können dies auf der Grundlage von Nachbarn und Trends leicht vorhersagen. Entsprechende Datenmatrix in …
Ich verstehe das Konzept der Skalierung der Datenmatrix zur Verwendung in einem linearen Regressionsmodell. In R könnten Sie beispielsweise Folgendes verwenden: scaled.data <- scale(data, scale=TRUE) Meine einzige Frage ist, für neue Beobachtungen, für die ich die Ausgabewerte vorhersagen möchte, wie sie richtig skaliert werden. Wäre es scaled.new <- (new - …
Ich arbeite in R durch ein hervorragendes PCA-Tutorial von Lindsay I Smith und stecke in der letzten Phase fest. Das unten stehende R-Skript führt uns bis zu dem Punkt (auf Seite 19), an dem die ursprünglichen Daten aus der (in diesem Fall singulären) Hauptkomponente rekonstruiert werden. Dabei sollte sich entlang …
Ich habe über Student's T-Test gelesen, aber es scheint zu funktionieren, wenn wir davon ausgehen können, dass die ursprünglichen Distributionen normal verteilt sind. In meinem Fall sind sie definitiv nicht. Muss ich 13^2Tests durchführen , wenn ich 13 Distributionen habe ?
Ich benutze die R "Multcomp" -Bibliothek ( http://cran.r-project.org/web/packages/multcomp/ ), um Dunnetts Test zu berechnen. Ich benutze das folgende Skript: Group <- factor(c("A","A","B","B","B","C","C","C","D","D","D","E","E","F","F","F")) Value <- c(5,5.09901951359278,4.69041575982343,4.58257569495584,4.79583152331272,5,5.09901951359278,4.24264068711928,5.09901951359278,5.19615242270663,4.58257569495584,6.16441400296898,6.85565460040104,7.68114574786861,7.07106781186548,6.48074069840786) data <- data.frame(Group, Value) aov <- aov(Value ~ Group, data) summary(glht(aov, linfct=mcp(Group="Dunnett"))) Wenn ich dieses Skript nun mehrmals über die R-Konsole ausführe, erhalte ich jedes …
In R (2.15.2) habe ich einmal eine ARIMA (3,1,3) auf eine Zeitreihe und einmal eine ARMA (3,3) auf die einmal differenzierten Zeitreihen gepasst. Die angepassten Parameter unterscheiden sich, was ich der Anpassungsmethode in ARIMA zuschrieb. Auch das Anpassen einer ARIMA (3,0,3) an dieselben Daten wie ARMA (3,3) führt nicht zu …
Ich habe eine multiple Regression durchgeführt, bei der das Modell als Ganzes signifikant ist und ungefähr 13% der Varianz erklärt. Ich muss jedoch den Betrag der Varianz finden, der von jedem signifikanten Prädiktor erklärt wird. Wie kann ich das mit R machen? Hier sind einige Beispieldaten und Code: D = …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.