Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.
Mit Amelia in R erhielt ich mehrere unterstellte Datensätze. Danach führte ich einen Test mit wiederholten Messungen in SPSS durch. Jetzt möchte ich die Testergebnisse bündeln. Ich weiß, dass ich Rubins Regeln (implementiert durch ein beliebiges Paket mit mehreren Imputationen in R) verwenden kann, um Mittelwerte und Standardfehler zu bündeln, …
Gibt es eine Strategie zur Auswahl der Anzahl der Bäume in einem GBM? Insbesondere das ntreesArgument in Rder gbmFunktion. Ich verstehe nicht, warum Sie nicht ntreesden höchsten vernünftigen Wert einstellen sollten . Ich habe festgestellt, dass eine größere Anzahl von Bäumen die Variabilität der Ergebnisse mehrerer GBMs deutlich verringert. Ich …
Ich versuche, das neuralnetPaket von R (Dokumentation hier ) zur Vorhersage zu verwenden. Hier, was ich versuche zu tun: library(neuralnet) x <- cbind(runif(50, min=1, max=500), runif(50, min=1, max=500)) y <- x[, 1] * x[, 2] train <- data.frame(x, y) n <- names(train) f <- as.formula(paste('y ~', paste(n[!n %in% 'y'], collapse …
Ich habe einen 20-jährigen Datensatz mit einer jährlichen Anzahl von Arten für eine Reihe von Polygonen (~ 200 unregelmäßig geformte, kontinuierliche Polygone). Ich habe eine Regressionsanalyse verwendet, um Trends (Änderung der Anzahl pro Jahr) für jedes Polygon sowie Aggregationen von Polygondaten basierend auf Verwaltungsgrenzen abzuleiten. Ich bin sicher, dass die …
Betrachten Sie den folgenden Code und die folgende Ausgabe: par(mfrow=c(3,2)) # generate random data from weibull distribution x = rweibull(20, 8, 2) # Quantile-Quantile Plot for different distributions qqPlot(x, "log-normal") qqPlot(x, "normal") qqPlot(x, "exponential", DB = TRUE) qqPlot(x, "cauchy") qqPlot(x, "weibull") qqPlot(x, "logistic") Es scheint, dass das QQ-Diagramm für log-normal …
Für Zähldaten, die ich gesammelt habe, verwende ich die Poisson-Regression, um Modelle zu erstellen. Ich mache das mit der glmFunktion in R, wo ich benutze family = "poisson". Um mögliche Modelle zu bewerten (ich habe mehrere Prädiktoren), verwende ich den AIC. So weit, ist es gut. Jetzt möchte ich eine …
Ich habe einen Datensatz, der die Anzahl der Aktionen enthält, die von Einzelpersonen innerhalb von 7 Tagen ausgeführt wurden. Die spezifische Aktion sollte für diese Frage nicht relevant sein. Hier einige beschreibende Statistiken für den Datensatz: AngebotBedeutenVarianzAnzahl der Beobachtungen0 - 77218.22791696Angebot0- -772Bedeuten18.2Varianz2791Anzahl der Beobachtungen696 \begin{array}{|c|c|} \hline \text{Range} & 0 - …
Die randomForest-Implementierung erlaubt keine Stichproben über die Anzahl der Beobachtungen hinaus, selbst wenn Stichproben mit Ersatz erstellt werden. Warum ist das? Funktioniert gut: rf <- randomForest(Species ~ ., iris, sampsize=c(1, 1, 1), replace=TRUE) rf <- randomForest(Species ~ ., iris, sampsize=3, replace=TRUE) Was ich machen will; was ich vorhabe zu tun: …
Für die Analyse der Anzahl der nicht aufgeblasenen Vögel möchte ich Modelle mit der Anzahl der nicht aufgeblasenen Vögel unter Verwendung des R-Pakets pscl anwenden . Wenn ich mir jedoch das Beispiel in der Dokumentation für eine der Hauptfunktionen ( ? Zeroinfl ) ansehe , bezweifle ich, was der wahre …
Ich möchte verwenden lme4, um eine Regression mit gemischten Effekten anzupassen und multcompdie paarweisen Vergleiche zu berechnen. Ich habe einen komplexen Datensatz mit mehreren kontinuierlichen und kategorialen Prädiktoren, aber meine Frage kann am Beispiel des integrierten ChickWeightDatensatzes demonstriert werden : m <- lmer(weight ~ Time * Diet + (1 | …
Ich möchte testen, welche Regression am besten zu meinen Daten passt. Meine abhängige Variable ist eine Zählung und hat viele Nullen. Und ich würde Hilfe brauchen, um zu bestimmen, welches Modell und welche Familie verwendet werden sollen (Poisson oder Quasipoisson oder Poisson-Regression ohne Inflation) und wie die Annahmen getestet werden …
Ich möchte die Ergebnisse eines Clusters (erstellt mit protoclust{protoclust}) visualisieren, indem ich Scater-Diagramme für jedes Variablenpaar erstelle, das zum Klassifizieren meiner Daten verwendet wird, nach Klassen färbt und die Ellipsen für das 95% -Konfidenzintervall für jede der Klassen überlappt (um zu überprüfen, welche elipses-Klassen überlappen sich unter jedem Variablenpaar. Ich …
Hallo, ich nehme an einem Abschlusskurs in Statistik teil und wir haben uns mit Teststatistik und anderen Konzepten befasst. Ich bin jedoch oft in der Lage, die Formeln anzuwenden und eine Art Intuition darüber zu entwickeln, wie Dinge funktionieren, aber ich habe oft das Gefühl, dass ich, wenn ich meine …
Ich versuche, eine Zeitreihe auf vierteljährliche Stichprobendaten (tierische Biomasse) über einen Zeitraum von 10 Jahren mit 3 Wiederholungen pro Quartal anzuwenden. Also 40 Daten, aber insgesamt 120 Beobachtungen. Ich habe SARIMA'a in Shumway und Stoffers Zeitreihenanalyse und ihren Anwendungen gelesen und Woodward et al. Die angewandte Zeitreihenanalyse von al., und …
Wir haben 60 Personen gebeten, so viele Restaurant-Franchise-Unternehmen wie möglich in Atlanta aufzulisten. Die Gesamtliste umfasste über 70 Restaurants, aber wir haben diejenigen eliminiert, die von weniger als 10% der Bevölkerung erwähnt wurden, und haben 45 übrig gelassen. Für diese 45 haben wir den Anteil der Informanten berechnet, die das …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.