Bezieht sich auf jedes Modell, bei dem eine Zufallsvariable durch eine Funktion, die in einer endlichen Anzahl von Parametern linear ist, mit einer oder mehreren Zufallsvariablen verknüpft ist.
Ist die Neugestaltung eines multivariaten linearen Regressionsmodells als multiple lineare Regression völlig gleichwertig? Ich beziehe mich nicht einfach laufen separate Regressionen.ttt Ich habe an einigen Stellen gelesen (Bayesian Data Analysis - Gelman et al. Und Multivariate Old School - Marden), dass ein multivariates lineares Modell leicht als multiple Regression umparametriert …
Ich benötige einige Ratschläge in Bezug auf zwei Hauptprobleme in meiner Forschung, die eine Fallstudie von drei großen Pharmazeutika und Innovationen ist. Anzahl der Patente pro Jahr ist die abhängige Variable. Meine Fragen sind Was sind die wichtigsten Kriterien für ein gutes Modell? Was ist mehr / weniger wichtig? Sind …
Ich habe ein lineares Regressionsmodell unter Verwendung einer Reihe von Variablen / Merkmalen trainiert. Und das Modell hat eine gute Leistung. Ich habe jedoch festgestellt, dass es keine Variable gibt, die mit der vorhergesagten Variablen gut korreliert. Wie ist es möglich?
Betrachten Sie das einfache lineare Modell: yy=X′ββ+ϵyy=X′ββ+ϵ\pmb{y}=X'\pmb{\beta}+\epsilon wo ϵi∼i.i.d.N(0,σ2)ϵi∼i.i.d.N(0,σ2)\epsilon_i\sim\mathrm{i.i.d.}\;\mathcal{N}(0,\sigma^2) und X∈Rn×pX∈Rn×pX\in\mathbb{R}^{n\times p} ,p≥2p≥2p\geq2 undXXX enthalten eine Spalte von Konstanten. Meine Frage ist: Gibt es bei E(X′X)E(X′X)\mathrm{E}(X'X) , ββ\beta und σσ\sigma eine Formel für eine nicht triviale Obergrenze für E(R2)E(R2)\mathrm{E}(R^2) *? (unter der Annahme, dass das Modell von OLS geschätzt wurde). …
In der Praxis ist die Verwendung eines Standard-T-Tests zur Überprüfung der Signifikanz eines linearen Regressionskoeffizienten gängige Praxis. Die Mechanik der Berechnung macht für mich Sinn. Warum kann die T-Verteilung verwendet werden, um die Standardteststatistik zu modellieren, die beim Testen von linearen Regressionshypothesen verwendet wird? Standardteststatistik, auf die ich mich hier …
Wie in diesem Kurshandbuch (Seite 1) erläutert , kann ein lineares Modell in folgender Form geschrieben werden: y=β1x1+⋯+βpxp+εi,y=β1x1+⋯+βpxp+εi, y = \beta_1 x_{1} + \cdots + \beta_p x_{p} + \varepsilon_i, Dabei ist die Antwortvariable und die erklärende Variable .yyyxixix_{i}ithithi^{th} Mit dem Ziel, Testannahmen zu erfüllen, kann man häufig die Antwortvariable transformieren. …
In linearen Modellen müssen wir prüfen, ob eine Beziehung zwischen den erklärenden Variablen besteht. Wenn sie zu stark korrelieren, liegt Kollinearität vor (dh die Variablen erklären sich teilweise gegenseitig). Ich betrachte gerade die paarweise Korrelation zwischen jeder der erklärenden Variablen. Frage 1: Was stuft zu viel Korrelation ein? Ist beispielsweise …
Ich habe ein funktionierendes Beispiel (in R), das ich weiter zu verstehen versuche. Ich benutze Limma, um ein lineares Modell zu erstellen, und versuche zu verstehen, was in den Fold Change-Berechnungen Schritt für Schritt vor sich geht. Ich versuche hauptsächlich herauszufinden, was passiert, um die Koeffizienten zu berechnen. Nach allem, …
Nachdem ich hier die linearen Modellkoeffizienten geklärt habe, habe ich eine weitere Frage bezüglich der Nicht-Signifikanz (hoher p-Wert) für Koeffizienten von Faktorstufen. Beispiel: Wenn mein lineares Modell einen Faktor mit 10 Stufen enthält und nur 3 dieser Stufen mit signifikanten p-Werten verknüpft sind, kann ich bei Verwendung des Modells zur …
Ich habe ein klassisches lineares Modell mit 5 möglichen Regressoren. Sie sind nicht miteinander korreliert und weisen eine relativ geringe Korrelation mit der Antwort auf. Ich bin zu einem Modell gekommen, bei dem 3 der Regressoren signifikante Koeffizienten für ihre t-Statistik haben (p <0,05). Wenn Sie eine oder beide der …
Derzeit bewerte ich die Multikollinearität in meinen Datensätzen. Welche Schwellenwerte von VIF und Zustandsindex unter / über deuten auf ein Problem hin? VIF: Ich habe gehört, dass VIF ein Problem ist.≥ 10≥10\geq 10 Nach dem Entfernen von zwei Problemvariablen beträgt VIF für jede Variable . Müssen die Variablen weiter behandelt …
In der linearen Regression (quadratischer Verlust) haben wir mithilfe der Matrix eine sehr präzise Notation für das Ziel minimize ∥Ax−b∥2minimize ‖Ax−b‖2\text{minimize}~~ \|Ax-b\|^2 Dabei ist AAA die Datenmatrix, xxx die Koeffizienten und bbb die Antwort. Gibt es eine ähnliche Matrixnotation für das logistische Regressionsziel? Alle die Bezeichnungen ich gesehen habe , …
Ich bin ein Software-Ingenieur, der am maschinellen Lernen arbeitet. Nach meinem Verständnis bilden lineare Regression (wie OLS) und lineare Klassifikation (wie logistische Regression und SVM) eine Vorhersage auf der Grundlage eines inneren Produkts zwischen trainierten Koeffizienten und Merkmalsvariablen :w⃗ w→\vec{w}x⃗ x→\vec{x} y^=f(w⃗ ⋅x⃗ )=f(∑iwixi)y^=f(w→⋅x→)=f(∑iwixi) \hat{y} = f(\vec{w} \cdot \vec{x}) = …
Also habe ich mit SVMs rumgespielt und ich frage mich, ob das eine gute Sache ist: Ich habe eine Reihe von fortlaufenden Features (0 bis 1) und eine Reihe von kategorialen Features, die ich in Dummy-Variablen konvertiert habe. In diesem speziellen Fall codiere ich das Datum der Messung in eine …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.