Die Residuen eines Modells sind die tatsächlichen Werte abzüglich der vorhergesagten Werte. Viele statistische Modelle treffen Annahmen über den Fehler, der durch die Residuen geschätzt wird.
Diese Frage ergibt sich aus meiner tatsächlichen Verwirrung darüber, wie ich entscheiden soll, ob ein Logistikmodell gut genug ist. Ich habe Modelle, die den Zustand von Paaren zwei Jahre nach ihrer Bildung als abhängige Variable als Einzelprojekt verwenden. Das Ergebnis ist erfolgreich (1) oder nicht (0). Ich habe unabhängige Variablen …
Ich habe mit mehreren Labormitgliedern darüber diskutiert, und wir sind zu mehreren Quellen gegangen, haben aber immer noch nicht die richtige Antwort: Wenn wir sagen, dass ein GLM eine Poisson- Familie hat , sprechen wir dann von der Verteilung der Residuen oder der Antwortvariablen? Streitpunkte In diesem Artikel heißt es, …
Bei der Modellierung von Zeitreihen besteht die Möglichkeit, (1) die Korrelationsstruktur der Fehlerterme zu modellieren, indem zB ein AR (1) -Prozess (2) die verzögerte abhängige Variable als erklärende Variable einbezieht (rechts) Ich verstehe, dass dies manchmal wichtige Gründe sind (2). Was sind jedoch die methodischen Gründe , um entweder (1) …
Ich habe das Modell mit optimiert caret, aber dann das Modell mit dem gbmPaket erneut ausgeführt. Nach meinem Verständnis sollten das verwendete caretPaket gbmund die Ausgabe identisch sein. Nur ein kurzer Testlauf mit data(iris)zeigt jedoch eine Diskrepanz im Modell von etwa 5% unter Verwendung von RMSE und R ^ 2 …
Hier wird die Fehlinterpretation der Annahme der Normalität in der linearen Regression diskutiert (die 'Normalität' bezieht sich eher auf das X und / oder Y als auf die Residuen), und das Poster fragt, ob es möglich ist, nicht normalverteiltes X und Y zu haben und haben noch normalverteilte Residuen. Meine …
Ich habe einen sehr großen Datensatz und es fehlen ungefähr 5% zufällige Werte. Diese Variablen sind miteinander korreliert. Der folgende Beispiel-R-Datensatz ist nur ein Spielzeugbeispiel mit Dummy-korrelierten Daten. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, 2000000, replace = TRUE), ncol = 10000) colnames(xmat) <- paste ("M", 1:10000, sep …
Warum ist es notwendig, die Verteilungsannahme auf die Fehler zu setzen, dh yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} mitϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) . Warum nicht schreiben yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} mityi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) , wobei in jedem Fall ϵi=yi−y^ϵi=yi−y^\epsilon_i = y_i - \hat{y} . Ich habe gesehen, wie betont wurde, dass …
Ich bin ein Doktorand in experimenteller Psychologie und ich bemühe mich sehr, meine Fähigkeiten und Kenntnisse im Analysieren meiner Daten zu verbessern. Bis zu meinem 5. Jahr in Psychologie dachte ich, dass die regressionsähnlichen Modelle (zB ANOVA) die folgenden Dinge annehmen: Normalität der Daten Varianzhomogenität für die Daten und so …
Ich führe ein verallgemeinertes lineares Modell durch, bei dem ich eine andere als die normale Familie angeben muss. Wie ist die erwartete Verteilung der Residuen? Sollen die Residuen beispielsweise normal verteilt werden?
Diese Frage ist allgemein und langwierig, aber bitte nehmen Sie Kontakt mit mir auf. In meiner Anwendung habe ich viele Datensätze, die jeweils aus ~ 20.000 Datenpunkten mit ~ 50 Features und einer einzelnen abhängigen Binärvariablen bestehen. Ich versuche, die Datensätze mithilfe einer regulierten logistischen Regression (R-Paket glmnet ) zu …
Ich habe eine lineare Regression, die ziemlich gut ist, denke ich (es ist für ein Universitätsprojekt, also muss ich nicht wirklich sehr genau sein). Punkt ist, wenn ich die Residuen gegen vorhergesagte Werte zeichne, gibt es (laut meinem Lehrer) einen Hinweis auf Heteroskedastizität. Aber wenn ich das QQ-Diagramm der Residuen …
Ich versuche, eine multiple lineare Regression in R mit einer Gleichung wie der folgenden zu schätzen: regr <- lm(rate ~ constant + askings + questions + 0) Fragen und Antworten sind vierteljährliche Datenzeitreihen, die mit erstellt wurden askings <- ts(...). Das Problem ist jetzt, dass ich autokorrelierte Residuen habe. Ich …
Dies ist eine Mosaikdarstellung des hierHairEyeColor beschriebenen Kontingenztabellendatensatzes . Wie interpretiere ich die Farben, die Residuen darstellen? Was ist der Unterschied zwischen hohen und positiven Pearson-Residuen (blau dargestellt) und niedrigen und negativen roten Residuen?
Ich wollte den genauen Test des Fischers besser verstehen, deshalb habe ich das folgende Spielzeugbeispiel entwickelt, bei dem f und m männlich und weiblich und n und y dem "Sodakonsum" wie folgt entsprechen: > soda_gender f m n 0 5 y 5 0 Dies ist natürlich eine drastische Vereinfachung, aber …
Bei einer einfachen linearen Regression möchte man oft überprüfen, ob bestimmte Annahmen erfüllt sind, um Rückschlüsse ziehen zu können (z. B. sind Residuen normalverteilt). Ist es sinnvoll, die Annahmen zu überprüfen, indem überprüft wird, ob die angepassten Werte normal verteilt sind?
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.