Eine Regression von yyy auf xxx muss nicht kausal sein, wenn Variablen ausgelassen werden, die sowohl xxx als auch yyy . Aber wenn nicht für ausgelassene Variablen und Messfehler, ist eine Regression kausal? Das heißt, wenn jede mögliche Variable in der Regression enthalten ist?
Ich lese über die Auswahl der besten Teilmengen im Buch Elemente des statistischen Lernens. Wenn ich 3 Prädiktoren , erstelle ich 2 3 = 8 Teilmengen:x1,x2,x3x1,x2,x3x_1,x_2,x_323=823=82^3=8 Teilmenge ohne Prädiktoren Teilmenge mit Prädiktor x1x1x_1 Teilmenge mit Prädiktor x2x2x_2 Teilmenge mit Prädiktor x3x3x_3 Teilmenge mit Prädiktoren x1,x2x1,x2x_1,x_2 Teilmenge mit Prädiktoren x1,x3x1,x3x_1,x_3 Teilmenge …
In letzter Zeit musste ich mehrere Artikel in Wirtschaftswissenschaften lesen (ein Bereich, mit dem ich nicht allzu vertraut bin). Eine Sache, die mir aufgefallen ist, ist, dass mit OLS angepasste lineare Regressionsmodelle allgegenwärtig sind, selbst wenn die Antwortvariable binär ist. Meine Frage lautet daher: Warum wird die lineare Regression beispielsweise …
Ich habe diese Frage in Bezug auf eine groß angelegte Regression ( Link ) gelesen , in der whuber einen interessanten Punkt wie folgt hervorhob : "Nahezu jeder statistische Test, den Sie durchführen, ist so leistungsfähig, dass Sie mit ziemlicher Sicherheit einen" signifikanten "Effekt feststellen können. Sie müssen sich viel …
Eine L1L1L_1 -Norm ist (zumindest teilweise) eindeutig, da p=1p=1p=1 an der Grenze zwischen nicht konvex und konvex liegt. Eine L1L1L_1 -Norm ist die 'spärlichste' konvexe Norm (oder?). Ich verstehe, dass die euklidische Norm p=2p=2p=2 Wurzeln in der Geometrie hat und eine klare Interpretation hat, wenn Dimensionen die gleichen Einheiten haben. …
Ich weiß, dass bei der linearen Regression die Antwortvariable stetig sein muss, aber warum ist das so? Ich kann nichts online finden, was erklärt, warum ich keine diskreten Daten für die Antwortvariable verwenden kann.
Wenig Hintergrund Ich arbeite an der Interpretation der Regressionsanalyse, aber ich bin sehr verwirrt über die Bedeutung von r, r im Quadrat und der restlichen Standardabweichung. Ich kenne die Definitionen: Charakterisierungen r misst die Stärke und Richtung einer linearen Beziehung zwischen zwei Variablen in einem Streudiagramm Das R-Quadrat ist ein …
In Bishops Buch über maschinelles Lernen wird das Problem der Kurvenanpassung einer Polynomfunktion an eine Reihe von Datenpunkten erörtert. Sei M die Ordnung des angepassten Polynoms. Es heißt so Wir sehen, dass mit zunehmendem M die Größe der Koeffizienten typischerweise größer wird. Insbesondere für das M = 9 - Polynom …
Mit zwei Zufallsvariablen ξξ\xi und ηη\eta können wir ihren "Korrelationskoeffizienten" berechnen cccund die Linie der besten Anpassung zwischen diesen beiden Zufallsvariablen bilden. Meine Frage ist warum? 1) Es gibt Zufallsvariablen, ξξ\xi und ηη\eta die in schlechtester Weise abhängig sind, dh und trotzdem . Wenn man nur an lineare Regression denkt, …
In Statistical Methods in the Atmospheric Sciences stellt Daniel Wilks fest, dass multiple lineare Regression zu Problemen führen kann, wenn zwischen den Prädiktoren sehr starke Wechselbeziehungen bestehen (3. Auflage, Seite 559-560): Eine Pathologie, die bei der multiplen linearen Regression auftreten kann, besteht darin, dass ein Satz von Prädiktorvariablen mit starken …
Eine peinlich einfache Frage - aber es scheint, dass sie bei Cross Validated noch nicht gestellt wurde: Was ist die Definition eines Regressionsmodells? Auch eine Support-Frage, Was ist kein Regressionsmodell? In Bezug auf Letzteres interessieren mich knifflige Beispiele, bei denen die Antwort nicht sofort offensichtlich ist. Beispielsweise, Was ist mit …
Diese Frage ist inspiriert von der langen Diskussion in den Kommentaren hier: Wie verwendet die lineare Regression die Normalverteilung? In dem üblichen linearen Regressionsmodell wird hier der Einfachheit halber mit nur einem Prädiktor geschrieben: wobei bekannte Konstanten sind und unabhängige Fehlerterme mit dem Mittelwert Null sind. Wenn wir zusätzlich Normalverteilungen …
Was ist eine partielle F-Statistik? Ist das dasselbe wie ein partieller F-Test? Wann würden Sie eine partielle F-Statistik berechnen? Ich gehe davon aus, dass dies etwas mit dem Vergleich von Regressionsmodellen zu tun hat, aber ich verfolge etwas nicht (?)
Ich habe eine Frage zu zwei verschiedenen Methoden aus verschiedenen Bibliotheken, die scheinbar den gleichen Job machen. Ich versuche, ein lineares Regressionsmodell zu erstellen. Hier ist der Code, den ich mit der Statistikmodellbibliothek mit OLS verwende: X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1) x_train = sm.add_constant(X_train) model = …
Ich arbeite an einigen syntaktischen Daten für das Error-In-Variable-Modell für einige Untersuchungen. Derzeit habe ich eine einzige unabhängige Variable und gehe davon aus, dass ich die Varianz für den wahren Wert der abhängigen Variablen kenne. Mit diesen Informationen kann ich also einen unverzerrten Schätzer für den Koeffizienten der abhängigen Variablen …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.