Als «regression» getaggte Fragen

Techniken zum Analysieren der Beziehung zwischen einer (oder mehreren) "abhängigen" Variablen und "unabhängigen" Variablen.

2
KKT versus uneingeschränkte Formulierung der Lasso-Regression
Die bestrafte L1-Regression (auch bekannt als Lasso) wird in zwei Formulierungen dargestellt. Die beiden Zielfunktionen seien Dann sind die beiden unterschiedlichen Formulierungen ArgminβQ1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1.Q1=12||Y−Xβ||22Q2=12||Y−Xβ||22+λ||β||1. Q_1 = \frac{1}{2}||Y - X\beta||_2^2 \\ Q_2 =\frac{1}{2}||Y - X\beta||_2^2 + \lambda ||\beta||_1. vorbehaltlich | | β | | 1 ≤ t , und,äquivalenten argmin βargminβQ1argminβQ1 \text{argmin}_\beta …

2
Umwandlung eines multivariaten linearen Modells in eine multiple Regression
Ist die Neugestaltung eines multivariaten linearen Regressionsmodells als multiple lineare Regression völlig gleichwertig? Ich beziehe mich nicht einfach laufen separate Regressionen.ttt Ich habe an einigen Stellen gelesen (Bayesian Data Analysis - Gelman et al. Und Multivariate Old School - Marden), dass ein multivariates lineares Modell leicht als multiple Regression umparametriert …

3
Wie werden Regressionskoeffizienten interpretiert, wenn die Antwort durch die 4. Wurzel transformiert wurde?
1/4Aufgrund der Heteroskedastizität verwende ich die vierte root ( ) - Potenztransformation für meine Antwortvariable. Jetzt bin ich mir jedoch nicht sicher, wie ich meine Regressionskoeffizienten interpretieren soll. Ich gehe davon aus, dass ich die Koeffizienten bei der Rücktransformation auf die vierte Potenz bringen müsste (siehe unten Regressionsausgabe). Alle Variablen …


1
Berechnen von Vorhersageintervallen für die logistische Regression
Ich möchte verstehen, wie man Vorhersageintervalle für logistische Regressionsschätzungen erzeugt. Mir wurde geraten, die Verfahren in Colletts Modeling Binary Data , 2nd Ed S.98-99, zu befolgen. Nachdem predict.glmich dieses Verfahren implementiert und mit Rs verglichen habe, denke ich, dass dieses Buch das Verfahren zum Berechnen von Konfidenzintervallen und nicht von …




6
Einfache Interpretation der linearen Regressionsausgabe
Ich habe eine einfache lineare Regression des natürlichen Logarithmus von 2 Variablen durchgeführt, um festzustellen, ob sie korrelieren. Meine Ausgabe ist diese: R^2 = 0.0893 slope = 0.851 p < 0.001 Ich bin verwirrt. Wenn ich den Wert betrachte, würde ich sagen, dass die beiden Variablen nicht korreliert sind, da …

4
Mittelung der Korrelationswerte
Angenommen, ich teste, wie die Variable unter verschiedenen Versuchsbedingungen von der Variablen Yabhängt X, und erhalte das folgende Diagramm: Die gestrichelten Linien in der obigen Grafik stellen die lineare Regression für jede Datenreihe dar (Versuchsaufbau), und die Zahlen in der Legende bezeichnen die Pearson-Korrelation für jede Datenreihe. Ich möchte die …

2
Schätzung der quadratischen und statistischen Signifikanz anhand des bestraften Regressionsmodells
Ich benutze das R-Paket bestraft , um geschrumpfte Koeffizientenschätzungen für einen Datensatz zu erhalten, bei dem ich viele Prädiktoren und wenig Wissen darüber habe, welche wichtig sind. Gibt es, nachdem ich die Abstimmungsparameter L1 und L2 ausgewählt und mit meinen Koeffizienten zufrieden bin, eine statistisch fundierte Möglichkeit, die Modellanpassung mit …

4
Was sind die korrekten Werte für Präzision und Rückruf in Randfällen?
Präzision ist definiert als: p = true positives / (true positives + false positives) Ist es richtig, dass sich die Genauigkeit 1 nähert true positivesund false positivessich 0 nähert? Gleiche Frage zum Rückruf: r = true positives / (true positives + false negatives) Ich führe derzeit einen statistischen Test durch, …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

5
Wann können Sie datenbasierte Kriterien verwenden, um ein Regressionsmodell anzugeben?
Ich habe gehört, dass, wenn viele Regressionsmodellspezifikationen (z. B. in OLS) als Möglichkeiten für einen Datensatz betrachtet werden, dies zu mehreren Vergleichsproblemen führt und die p-Werte und Konfidenzintervalle nicht mehr zuverlässig sind. Ein extremes Beispiel hierfür ist die schrittweise Regression. Wann kann ich die Daten selbst verwenden, um das Modell …

2
Wie macht es Sinn, OLS nach der LASSO-Variablenauswahl durchzuführen?
Kürzlich habe ich festgestellt, dass es in der angewandten ökonometrischen Literatur nicht ungewöhnlich ist, LASSO durchzuführen, gefolgt von einer OLS-Regression unter Verwendung der ausgewählten Variablen. Ich habe mich gefragt, wie wir die Gültigkeit eines solchen Verfahrens beurteilen können. Wird es Probleme wie ausgelassene Variablen verursachen? Gibt es Beweise dafür, dass …

2
Residuendiagramme: Warum Diagramm gegen angepasste Werte, nicht beobachtete Werte?
Im Zusammenhang mit der OLS-Regression verstehe ich, dass ein Residuendiagramm (gegen angepasste Werte) herkömmlicherweise betrachtet wird, um auf konstante Varianz zu testen und die Modellspezifikation zu bewerten. Warum werden die Residuen gegen die Anpassungen und nicht gegen die Werte aufgetragen ? Inwiefern unterscheiden sich die Informationen von diesen beiden Darstellungen?Y.Y.Y …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.