Ich bin es nicht gewohnt, Variablen im Datumsformat in R zu verwenden. Ich frage mich nur, ob es möglich ist, eine Datumsvariable als erklärende Variable in einem linearen Regressionsmodell hinzuzufügen. Wie können wir den Koeffizienten interpretieren, wenn es möglich ist? Ist es die Auswirkung eines Tages auf die Ergebnisvariable? Sehen …
Angenommen, ich habe eine multivariable (mehrere unabhängige Variablen) Regression, die aus 3 Variablen besteht. Jede dieser Variablen hat einen bestimmten Koeffizienten. Wenn ich mich entscheide, eine vierte Variable einzuführen und die Regression erneut auszuführen, ändern sich dann die Koeffizienten der drei ursprünglichen Variablen? Im weiteren Sinne: Wird bei einer multivariablen …
Berücksichtigen Sie die lineare Regression mit einer gewissen Regularisierung: ZB Finden Sie , das minimiert| | A x - b | | 2 + λ | | x | | 1xxx| | Ax-b | |2+ λ | | x | |1||Ax−b||2+λ||x||1||Ax - b||^2+\lambda||x||_1 Normalerweise sind die Spalten von A so …
Ich bin ziemlich neu darin, also hoffe ich, dass Sie mir vergeben, wenn die Frage naiv ist. (Kontext: Ich lerne Ökonometrie aus Davidson & MacKinnons Buch "Econometric Theory and Methods" und sie scheinen dies nicht zu erklären. Ich habe mir auch Luenbergers Optimierungsbuch angesehen, das sich mit Projektionen auf einem …
Das Modell der linearen Regression geht von einer Reihe von Annahmen aus, die die Quantilregression nicht zulässt. Wenn die Annahmen der linearen Regression erfüllt sind, ist meine Intuition (und einige sehr begrenzte Erfahrungen), dass die mediane Regression nahezu identische Ergebnisse wie die lineare Regression liefert. Welche Vorteile hat die lineare …
Angenommen , wir haben zwei Regressionsbäume (Baum A und B - Baum) , die Karteneingabe zur Ausgabe y ∈ R . Lassen y = f A ( x ) für Baum - A und f B ( x ) für Baum B. Jeder Baum binäre Splits verwendet, mit Hyperebenen wie …
Ich versuche, eine Abbildung zu erstellen, die die Beziehung zwischen Viruskopien und Genomabdeckung (GCC) zeigt. So sehen meine Daten aus: Zuerst habe ich nur eine lineare Regression gezeichnet, aber meine Vorgesetzten sagten mir, dass dies nicht korrekt sei, und versuchten es mit einer Sigmoidalkurve. Also habe ich das mit geom_smooth …
Ich habe ein Vorhersagemodell mit vier Methoden getestet, wie Sie in der Boxplot-Abbildung unten sehen können. Das vom Modell vorhergesagte Attribut liegt im Bereich von 0 bis 8. Möglicherweise stellen Sie fest, dass bei allen Methoden ein Ausreißer mit Obergrenze und drei Ausreißer mit Untergrenze angegeben sind. Ich frage mich, …
Angenommen, Sie passen eine lineare / logistische Regression mit dem Ziel einer unverzerrten Schätzung von . Sie sind sehr zuversichtlich, dass sowohl als auch in Bezug auf das Rauschen in ihren Schätzungen sehr positiv sind.a 1G( y) = a0+ a1⋅ x1+ a2⋅ x2g(y)=a0+a1⋅x1+a2⋅x2g(y) = a_0 + a_1\cdot x_1 + a_2\cdot …
Ich experimentiere mit dem Algorithmus der Gradientenverstärkungsmaschine über das caretPaket in R. Unter Verwendung eines kleinen Datensatzes für Hochschulzulassungen habe ich den folgenden Code ausgeführt: library(caret) ### Load admissions dataset. ### mydata <- read.csv("http://www.ats.ucla.edu/stat/data/binary.csv") ### Create yes/no levels for admission. ### mydata$admit_factor[mydata$admit==0] <- "no" mydata$admit_factor[mydata$admit==1] <- "yes" ### Gradient boosting …
Ich versuche derzeit, ein lineares Modell ( family = gaussian) auf einen Indikator für die biologische Vielfalt anzuwenden , der keine Werte unter Null annehmen kann, keine Inflation aufweist und kontinuierlich ist. Die Werte reichen von 0 bis etwas über 0,25. Infolgedessen gibt es in den Residuen des Modells ein …
Ich habe ein funktionierendes Beispiel (in R), das ich weiter zu verstehen versuche. Ich benutze Limma, um ein lineares Modell zu erstellen, und versuche zu verstehen, was in den Fold Change-Berechnungen Schritt für Schritt vor sich geht. Ich versuche hauptsächlich herauszufinden, was passiert, um die Koeffizienten zu berechnen. Nach allem, …
Ich habe einige Profis der Diskriminanzanalyse gefunden und habe Fragen dazu. So: Wenn die Klassen gut voneinander getrennt sind, sind die Parameterschätzungen für die logistische Regression überraschend instabil. Koeffizienten können bis unendlich gehen. LDA leidet nicht unter diesem Problem. Wenn die Anzahl der Merkmale gering ist und die Verteilung der …
Für ein lineares Modell bietet die OLS-Lösung den besten linearen unverzerrten Schätzer für die Parameter. Natürlich können wir eine Tendenz für eine geringere Varianz eintauschen, z. B. eine Kammregression. Aber meine Frage bezieht sich darauf, keine Vorurteile zu haben. Gibt es andere Schätzer, die etwas gebräuchlich sind, aber eine höhere …
Ich versuche den Bias-Varianz-Kompromiss, die Beziehung zwischen dem Bias des Schätzers und dem Bias des Modells und die Beziehung zwischen der Varianz des Schätzers und der Varianz des Modells zu verstehen. Ich bin zu folgenden Schlussfolgerungen gekommen: Wir neigen dazu, die Daten zu überdecken, wenn wir die Abweichung des Schätzers …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.