Als «regression» getaggte Fragen

Techniken zum Analysieren der Beziehung zwischen einer (oder mehreren) "abhängigen" Variablen und "unabhängigen" Variablen.


2
Warum wird die Auswahl der besten Teilmenge im Vergleich zu Lasso nicht bevorzugt?
Ich lese über die Auswahl der besten Teilmengen im Buch Elemente des statistischen Lernens. Wenn ich 3 Prädiktoren , erstelle ich 2 3 = 8 Teilmengen:x1,x2,x3x1,x2,x3x_1,x_2,x_323=823=82^3=8 Teilmenge ohne Prädiktoren Teilmenge mit Prädiktor x1x1x_1 Teilmenge mit Prädiktor x2x2x_2 Teilmenge mit Prädiktor x3x3x_3 Teilmenge mit Prädiktoren x1,x2x1,x2x_1,x_2 Teilmenge mit Prädiktoren x1,x3x1,x3x_1,x_3 Teilmenge …

2
Warum verwenden Wirtschaftsforscher die lineare Regression für binäre Antwortvariablen?
In letzter Zeit musste ich mehrere Artikel in Wirtschaftswissenschaften lesen (ein Bereich, mit dem ich nicht allzu vertraut bin). Eine Sache, die mir aufgefallen ist, ist, dass mit OLS angepasste lineare Regressionsmodelle allgegenwärtig sind, selbst wenn die Antwortvariable binär ist. Meine Frage lautet daher: Warum wird die lineare Regression beispielsweise …


4
Normen - Was ist das Besondere an
Eine L1L1L_1 -Norm ist (zumindest teilweise) eindeutig, da p=1p=1p=1 an der Grenze zwischen nicht konvex und konvex liegt. Eine L1L1L_1 -Norm ist die 'spärlichste' konvexe Norm (oder?). Ich verstehe, dass die euklidische Norm p=2p=2p=2 Wurzeln in der Geometrie hat und eine klare Interpretation hat, wenn Dimensionen die gleichen Einheiten haben. …


2
Was sagen r, r im Quadrat und die Reststandardabweichung über eine lineare Beziehung aus?
Wenig Hintergrund Ich arbeite an der Interpretation der Regressionsanalyse, aber ich bin sehr verwirrt über die Bedeutung von r, r im Quadrat und der restlichen Standardabweichung. Ich kenne die Definitionen: Charakterisierungen r misst die Stärke und Richtung einer linearen Beziehung zwischen zwei Variablen in einem Streudiagramm Das R-Quadrat ist ein …


5
Warum lineare Regression studieren?
Mit zwei Zufallsvariablen ξξ\xi und ηη\eta können wir ihren "Korrelationskoeffizienten" berechnen cccund die Linie der besten Anpassung zwischen diesen beiden Zufallsvariablen bilden. Meine Frage ist warum? 1) Es gibt Zufallsvariablen, ξξ\xi und ηη\eta die in schlechtester Weise abhängig sind, dh und trotzdem . Wenn man nur an lineare Regression denkt, …
13 regression 

1
Warum sagt Daniel Wilks (2011), dass die Regression der Hauptkomponenten „voreingenommen sein wird“?
In Statistical Methods in the Atmospheric Sciences stellt Daniel Wilks fest, dass multiple lineare Regression zu Problemen führen kann, wenn zwischen den Prädiktoren sehr starke Wechselbeziehungen bestehen (3. Auflage, Seite 559-560): Eine Pathologie, die bei der multiplen linearen Regression auftreten kann, besteht darin, dass ein Satz von Prädiktorvariablen mit starken …
13 regression  pca  bias 


3
Lineare Regression: Gibt es eine nicht normale Verteilung, die die Identität von OLS und MLE angibt?
Diese Frage ist inspiriert von der langen Diskussion in den Kommentaren hier: Wie verwendet die lineare Regression die Normalverteilung? In dem üblichen linearen Regressionsmodell wird hier der Einfachheit halber mit nur einem Prädiktor geschrieben: wobei bekannte Konstanten sind und unabhängige Fehlerterme mit dem Mittelwert Null sind. Wenn wir zusätzlich Normalverteilungen …

1
Was ist eine partielle F-Statistik?
Was ist eine partielle F-Statistik? Ist das dasselbe wie ein partieller F-Test? Wann würden Sie eine partielle F-Statistik berechnen? Ich gehe davon aus, dass dies etwas mit dem Vergleich von Regressionsmodellen zu tun hat, aber ich verfolge etwas nicht (?)

2
Unterschied zwischen Statistikmodell OLS und linearer Skikit-Regression
Ich habe eine Frage zu zwei verschiedenen Methoden aus verschiedenen Bibliotheken, die scheinbar den gleichen Job machen. Ich versuche, ein lineares Regressionsmodell zu erstellen. Hier ist der Code, den ich mit der Statistikmodellbibliothek mit OLS verwende: X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1) x_train = sm.add_constant(X_train) model = …

1
Verzerrter Schätzer für die Regression, der bessere Ergebnisse erzielt als der unverzerrte Schätzer im Modell für Fehler in Variablen
Ich arbeite an einigen syntaktischen Daten für das Error-In-Variable-Modell für einige Untersuchungen. Derzeit habe ich eine einzige unabhängige Variable und gehe davon aus, dass ich die Varianz für den wahren Wert der abhängigen Variablen kenne. Mit diesen Informationen kann ich also einen unverzerrten Schätzer für den Koeffizienten der abhängigen Variablen …

Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.