Verwenden Sie dieses Tag für jede * themenbezogene * Frage, bei der (a) "R" entweder als kritischer Teil der Frage oder als erwartete Antwort enthält, und (b) nicht * nur * die Verwendung von "R" betrifft.
Ich führte eine multivariate logistische Regression durch, wobei die abhängige Variable Yinnerhalb eines bestimmten Eintrittszeitraums der Tod in einem Pflegeheim war, und erhielt die folgenden Ergebnisse (beachten Sie, dass die Variablen, die darin beginnen A, ein kontinuierlicher Wert sind, während die Variablen, die in beginnen, Bkategorisch sind): Call: glm(Y ~ …
Was sind Parameter start, etastart, mustartin der GLM () Funktion ? Ich habe in den Dokumenten und im Internet gesucht, aber keine klare Erklärung gefunden, was dies bedeutet. Es ähnelt den bayesianischen "Anfangswerten" für die Ketten, aber ich bezweifle, dass dies zusammenhängt, da die Funktion glm () in R eine …
Angenommen, ich habe die folgenden Daten und führe ein Regressionsmodell aus: df=data.frame(income=c(5,3,47,8,6,5), won=c(0,0,1,1,1,0), age=c(18,18,23,50,19,39), home=c(0,0,1,0,0,1)) Einerseits führe ich ein lineares Modell aus, um das Einkommen vorherzusagen: md1 = lm(income ~ age + home + home, data=df) Zweitens führe ich ein Logit-Modell aus, um die gewonnene Variable vorherzusagen: md2 = glm(factor(won) …
Die R-Dokumentation für beide gibt nicht viel Aufschluss. Alles, was ich von diesem Link bekommen kann, ist, dass es in Ordnung sein sollte, einen von beiden zu verwenden. Was ich nicht verstehe ist, warum sie nicht gleich sind. Fakt: Die schrittweise Regressionsfunktion in R, step()verwendet extractAIC(). Interessanterweise führt das Ausführen …
Ich versuche, eine multiple lineare Regression in R mit einer Gleichung wie der folgenden zu schätzen: regr <- lm(rate ~ constant + askings + questions + 0) Fragen und Antworten sind vierteljährliche Datenzeitreihen, die mit erstellt wurden askings <- ts(...). Das Problem ist jetzt, dass ich autokorrelierte Residuen habe. Ich …
Frage in einem Satz: Weiß jemand, wie man gute Klassengewichte für einen zufälligen Wald bestimmt? Erläuterung: Ich spiele mit unausgeglichenen Datensätzen herum. Ich möchte das RPaket randomForestverwenden, um ein Modell auf einem sehr verzerrten Datensatz mit nur wenigen positiven und vielen negativen Beispielen zu trainieren. Ich weiß, es gibt andere …
Ich lese Steven Scotts Folien über das BSTS R-Paket (Sie finden sie hier: Folien ). Wenn er über die Einbeziehung vieler Regressoren in das strukturelle Zeitreihenmodell spricht, führt er irgendwann die Spitzen- und Plattenprioren von Regressionskoeffizienten ein und sagt, dass sie im Vergleich zu bestraften Methoden besser sind. Scott bezieht …
Meine Frage ist inspiriert R ‚s built-in exponentiellem Zufallszahlengenerator, die Funktion rexp(). Bei dem Versuch, exponentiell verteilte Zufallszahlen zu generieren, empfehlen viele Lehrbücher die inverse Transformationsmethode, wie auf dieser Wikipedia-Seite beschrieben . Mir ist bewusst, dass es andere Methoden gibt, um diese Aufgabe zu erfüllen. Insbesondere verwendet der Quellcode von …
Das R-Paket mclustverwendet BIC als Kriterium für die Auswahl des Clustermodells. Nach meinem Verständnis sollte ein Modell mit dem niedrigsten BIC gegenüber anderen Modellen ausgewählt werden (wenn Sie sich nur für BIC interessieren). Wenn jedoch alle BIC-Werte negativ sind, Mclustwird standardmäßig das Modell mit dem höchsten BIC-Wert verwendet. Mein allgemeines …
Ich forsche, um Unterschiede in der Fischdichte und im Fischartenreichtum zu untersuchen, wenn ich zwei verschiedene visuelle Unterwasserzählungsmethoden verwende. Meine Daten waren ursprünglich Zähldaten, aber normalerweise wird dies in Fischdichte geändert, aber ich habe mich immer noch für die Verwendung eines Poisson GLM entschieden, was hoffentlich richtig ist. model1 <- …
Ich habe halbstündliche Nachfragedaten, bei denen es sich um eine multisaisonale Zeitreihe handelt. Ich habe tbatsin forecastPaket in R verwendet und habe folgende Ergebnisse erhalten: TBATS(1, {5,4}, 0.838, {<48,6>, <336,6>, <17520,5>}) Bedeutet dies, dass die Serie nicht unbedingt die Box-Cox-Transformation verwenden muss und der Fehlerterm ARMA (5, 4) ist und …
Ich würde eine Frage zu diesem Thema stellen . Ich habe hier ein Beispiel für das Schreiben einer benutzerdefinierten Verlustfunktion für xgboost gefunden : loglossobj <- function(preds, dtrain) { # dtrain is the internal format of the training data # We extract the labels from the training data labels <- …
Ich versuche zu verstehen und zu wissen, was ich aus meiner Analyse einiger Daten mithilfe der Modellmittelung in R berichten soll. Ich verwende das folgende Skript, um die Auswirkung der Messmethode auf eine bestimmte Variable zu analysieren: Hier ist der Datensatz: https://www.dropbox.com/s/u9un273gzw9o30u/VMT4.csv?dl=0 Zu montierendes Modell: LM.1 <- gls(VMTf ~ turn+sex+method, …
Ich habe mehrere Stellen in Lehrbüchern identifiziert, an denen das GLM mit 5 Verteilungen beschrieben wird (nämlich Gamma, Gauß, Binomial, Inverses Gauß und Poisson). Dies zeigt sich auch in der Familienfunktion in R. Gelegentlich stoße ich auf Verweise auf das GLM, in denen zusätzliche Distributionen enthalten sind ( Beispiel ). …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.