Der erste Satz dieser Wiki- Seite besagt, dass "in der Ökonometrie ein Endogenitätsproblem auftritt, wenn eine erklärende Variable mit dem Fehlerterm korreliert wird. 1 " Meine Frage ist, wie kann das jemals passieren? Ist Regressions-Beta nicht so gewählt, dass der Fehlerterm orthogonal zum Spaltenraum der Entwurfsmatrix ist?
Nehmen wir zur Veranschaulichung meiner Frage an, ich habe einen Trainingssatz, in dem die Eingabe einen Rauschgrad aufweist, die Ausgabe jedoch nicht. # Training data [1.02, 1.95, 2.01, 3.06] : [1.0] [2.03, 4.11, 5.92, 8.00] : [2.0] [10.01, 11.02, 11.96, 12.04] : [1.0] [2.99, 6.06, 9.01, 12.10] : [3.0] hier …
Andrew Gelman in einem seiner letzten Blog-Beiträge sagt: Ich glaube nicht, dass für das Simpson-Paradoxon Kontrafakten oder potenzielle Ergebnisse notwendig sind. Ich sage das, weil man Simpsons Paradoxon mit Variablen aufstellen kann, die nicht manipuliert werden können oder für die Manipulationen nicht direkt von Interesse sind. Das Simpson-Paradoxon ist Teil …
Ich verstehe, dass der Wald-Test für Regressionskoeffizienten auf der folgenden Eigenschaft basiert, die asymptotisch gilt (z. B. Wasserman (2006): All of Statistics , S. 153, 214-215): Wobei den geschätzten Regressionskoeffizienten bezeichnet, bezeichnet den Standardfehler des Regressionskoeffizienten und ist der interessierende Wert ( ist normalerweise 0, um zu testen, ob der …
Ich möchte die R-Pakete Larsund Glmnet, die zur Lösung des Lasso-Problems verwendet werden , besser verstehen : (für Variablen und Stichproben, siehe www.stanford.edu/~hastie/Papers/glmnet.pdf auf Seite 3)pm i n( β0β) ∈ Rp + 1[ 12 N∑i = 1N( yich- β0- xTichβ)2+ λ | | β| |l1]michn(β0β)∈Rp+1[12N∑ich=1N(yich-β0-xichTβ)2+λ||β||l1]min_{(\beta_0 \beta) \in R^{p+1}} \left[\frac{1}{2N}\sum_{i=1}^{N}(y_i-\beta_0-x_i^T\beta)^2 + …
Es gab gute Fragen zum Umgang mit unausgeglichenen Daten im Klassifizierungskontext , aber ich frage mich, was die Leute tun, um eine Stichprobe für eine Regression zu erstellen. Angenommen, die Problemdomäne reagiert sehr empfindlich auf das Vorzeichen, aber nur etwas empfindlich auf die Größe des Ziels. Die Größe ist jedoch …
Ich möchte eine Variable auf x , x 2 , … , x 5 zurückführen . Sollte ich dazu rohe oder orthogonale Polynome verwenden? Ich habe mir Fragen auf der Website angesehen, die sich mit diesen beschäftigen, aber ich verstehe nicht wirklich, was der Unterschied zwischen der Verwendung ist. yyyx,x2,…,x5x,x2,…,x5x,x^2,\ldots,x^5 …
Was ist eine Ablationsstudie? Und gibt es eine systematische Möglichkeit, dies durchzuführen? Zum Beispiel habe ich Prädiktoren in einer linearen Regression, die ich als mein Modell bezeichnen werde.nnn Wie werde ich dazu eine Ablationsstudie durchführen? Welche Metriken soll ich verwenden? Eine umfassende Quelle oder ein Lehrbuch wäre willkommen.
Meine Frage entstand aus einer Diskussion mit @whuber in den Kommentaren einer anderen Frage . Konkret lautete der Kommentar von @whuber wie folgt: Ein Grund dafür könnte sein, dass die Annahmen, die einem Korrelationstest und einem Regressionssteigungstest zugrunde liegen, unterschiedlich sind. Selbst wenn wir verstehen, dass Korrelation und Steigung wirklich …
Ich möchte eine logistische Regression mit unausgeglichenen Daten modellieren (9: 1). Ich wollte die Gewichtsoption in der glmFunktion in R ausprobieren , bin mir aber nicht zu 100% sicher, was sie bewirkt. Nehmen wir an, meine Ausgabevariable ist c(0,0,0,0,0,0,0,0,0,1). jetzt möchte ich der "1" 10 mal mehr gewicht geben. Also …
EDIT: Da diese Frage aufgeblasen wurde, eine Zusammenfassung: Finden verschiedener aussagekräftiger und interpretierbarer Datensätze mit derselben gemischten Statistik (Mittelwert, Median, Mittlerer Bereich und die damit verbundenen Streuungen und Regressionen). Das Anscombe Quartett (siehe ? Purpose hoher Abmessungsdaten zu visualisieren ) ist ein bekanntes Beispiel von vier - Datensätzen mit dem …
Gelman und Hill (2006) schreiben auf Seite 46, dass: Die im Allgemeinen unwichtigste Regressionsannahme ist, dass die Fehler normal verteilt sind. Tatsächlich ist für die Schätzung der Regressionsgeraden (im Vergleich zur Vorhersage einzelner Datenpunkte) die Annahme der Normalität überhaupt nicht wichtig. Im Gegensatz zu vielen Regressionslehrbüchern empfehlen wir daher keine …
Was ist der Unterschied zwischen logistischer und logistischer Regression? Ich verstehe, dass sie ähnlich sind (oder sogar dasselbe), aber könnte jemand den Unterschied zwischen diesen beiden erklären? Geht es um Chancen?
Ich bin etwas verloren im Prozess der WLS-Regression. Ich habe einen Datensatz erhalten, und meine Aufgabe ist es, zu testen, ob Heteroskepsis vorliegt. Wenn ja, sollte ich eine WLS-Regression durchführen. Ich habe den Test durchgeführt und Beweise für heteroscedascity gefunden, also muss ich das WLS laufen lassen. Mir wurde gesagt, …
Kann jemand eine klare Liste der Unterschiede zwischen logarithmischer und logistischer Regression erstellen? Ich verstehe, dass ersteres ein einfaches lineares Regressionsmodell ist, aber mir ist nicht klar, wann jedes verwendet werden sollte.
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.