Als «multiple-regression» getaggte Fragen

Regression, die zwei oder mehr nicht konstante unabhängige Variablen enthält.


3
Forscher 1 führt 1000 Regressionen aus, Forscher 2 führt nur 1 aus, beide führen zu denselben Ergebnissen - sollten sie unterschiedliche Schlussfolgerungen ziehen?
Stellen Sie sich vor, ein Forscher untersucht einen Datensatz und führt 1000 verschiedene Regressionen durch und findet eine interessante Beziehung zwischen ihnen. Stellen Sie sich nun vor, ein anderer Forscher mit denselben Daten führt nur eine Regression aus, und es stellt sich heraus, dass der andere Forscher 1000 Regressionen durchgeführt …

1
Ist Just-Identified 2SLS voreingenommen im Median?
In Mostly Harmless Econometrics: Ein Empiricist's Companion (Angrist und Pischke, 2009: Seite 209) las ich Folgendes: (...) Tatsächlich ist gerade identifizierter 2SLS (etwa der einfache Wald-Schätzer) ungefähr unvoreingenommen . Dies ist formal schwer zu zeigen, da gerade identifizierte 2SLS keine Momente haben (dh die Stichprobenverteilung hat fette Schwänze). Trotzdem ist …


1
GBM-Paket vs. Caret mit GBM
Ich habe das Modell mit optimiert caret, aber dann das Modell mit dem gbmPaket erneut ausgeführt. Nach meinem Verständnis sollten das verwendete caretPaket gbmund die Ausgabe identisch sein. Nur ein kurzer Testlauf mit data(iris)zeigt jedoch eine Diskrepanz im Modell von etwa 5% unter Verwendung von RMSE und R ^ 2 …

1
Beweisen Sie die Beziehung zwischen Mahalanobis Abstand und Hebelwirkung?
Ich habe Formeln auf Wikipedia gesehen. die Mahalanobis Distanz und Hebelwirkung in Beziehung setzen: Der Mahalanobis-Abstand hängt eng mit der Verschuldungsstatistik , hat jedoch eine andere Skala:hhhD2=(N−1)(h−1N).D2=(N−1)(h−1N).D^2 = (N - 1)(h - \tfrac{1}{N}). In einem verlinkten Artikel beschreibt Wikipedia :hhh Im linearen Regressionsmodell die Hebel Punktzahl für die wird Dateneinheit …

1
Beeren-Inversion
Ich verfüge über umfangreiche Marktdaten zu Weinverkäufen in den USA und möchte die Nachfrage nach bestimmten Qualitätsweinen schätzen. Diese Marktanteile wurden grundsätzlich abgeleitet aus einem statistischen Gebrauchsmuster der Form , wo X umfasst beobachtet Produkteigenschaften, p bezeichnet Produktpreise,Uijt=X′jtβ−αpjt+ξjt+ϵijt≡δjt+ϵjtUijt=Xjt′β−αpjt+ξjt+ϵijt≡δjt+ϵjtU_{ijt} = X’_{jt}\beta - \alpha p_{jt} + \xi_{jt} + \epsilon_{ijt} \equiv \delta_{jt} + …

1
Gibt es ein Problem mit Multikollinearität und Splines-Regression?
Bei Verwendung natürlicher (dh eingeschränkter) kubischer Splines sind die erzeugten Basisfunktionen hochgradig kollinear, und bei Verwendung in einer Regression scheinen sich sehr hohe VIF-Statistiken (Varianzinflationsfaktor) zu ergeben, die Multikollinearität signalisieren. Wenn man den Fall eines Modells für Vorhersagezwecke in Betracht zieht, ist dies ein Problem? Es scheint, als ob dies …

2
Positive Korrelation und negatives Vorzeichen des Regressorkoeffizienten
Ist es möglich, eine positive Korrelation zwischen einem Regressor und einer Antwort ( +0,43) zu erhalten und anschließend einen negativen Koeffizienten im angepassten Regressionsmodell für diesen Regressor zu erhalten? Ich spreche nicht über Veränderungen im Zeichen des Regressors bei einigen Modellen. Das Koeffizientenzeichen bleibt immer erhalten. Könnten die verbleibenden Variablen …

1
Unterschiede zwischen PROC Mixed und lme / lmer in R - Freiheitsgraden
Hinweis: Diese Frage ist ein Repost, da meine vorherige Frage aus rechtlichen Gründen gelöscht werden musste. Beim Vergleich von PROC MIXED von SAS mit der Funktion lmeaus dem nlmePaket in R bin ich auf einige verwirrende Unterschiede gestoßen. Insbesondere unterscheiden sich die Freiheitsgrade in den verschiedenen Tests zwischen PROC MIXEDund …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 


1
Sollte Teil
Es folgt ein Modell, das aus einem mtcarsDatensatz erstellt wurde: > ols(mpg~wt+am+qsec, mtcars) Linear Regression Model ols(formula = mpg ~ wt + am + qsec, data = mtcars) Model Likelihood Discrimination Ratio Test Indexes Obs 32 LR chi2 60.64 R2 0.850 sigma 2.4588 d.f. 3 R2 adj 0.834 d.f. 28 …

1
Warum nicht jedes Mal eine robuste Regression?
Beispiele auf dieser Seite zeigen, dass die einfache Regression stark von Ausreißern beeinflusst wird und dies durch Techniken der robusten Regression überwunden werden kann: http://www.alastairsanderson.com/R/tutorials/robust-regression-in-R/ . Ich glaube, lmrob und ltsReg sind andere robuste Regressionstechniken. Warum sollte man nicht jedes Mal eine robuste Regression (wie rlm oder rq) durchführen, anstatt …

2
Verständnis des p-Wertes bei multipler linearer Regression
In Bezug auf den p-Wert der multiplen linearen Regressionsanalyse wird die Einführung von der Minitab-Website unten gezeigt. Der p-Wert für jeden Term testet die Nullhypothese, dass der Koeffizient gleich Null ist (kein Effekt). Ein niedriger p-Wert (<0,05) zeigt an, dass Sie die Nullhypothese ablehnen können. Mit anderen Worten, ein Prädiktor …

1
Multivariate Normalverteilung des Regressionskoeffizienten?
Beim Lesen eines Lehrbuchs über Regression stieß ich auf folgenden Absatz: Die Schätzung der kleinsten Quadrate eines Vektors linearer Regressionskoeffizienten ( ) istββ\beta β^=(XtX)−1Xtyβ^=(XtX)−1Xty \hat{\beta} = (X^{t}X)^{-1}{X^t}y Dies ist, wenn es als Funktion der Daten (unter Berücksichtigung der Prädiktoren X als Konstanten), eine lineare Kombination der Daten. Mit dem zentralen …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.