Nehmen wir an, ich habe zwei Datensätze mit jeweils n Beobachtungen von Datenpaaren der unabhängigen Variablen x und der abhängigen Variablen y . Nehmen wir weiter an, ich möchte für jeden Datensatz eine Verteilung der Regressionssteigungen erzeugen, indem ich die Beobachtungen (mit Ersetzung) N- mal bootstrappe und die Regression y …
Was ist der Unterschied zwischen Endogenität und nicht beobachteter Heterogenität? Ich weiß, dass Endogenität zum Beispiel von ausgelassenen Variablen herrührt. Soweit ich weiß, verursacht eine unbeobachtete Heterogenität dasselbe Problem. Aber wo genau liegt der Unterschied zwischen diesen beiden Begriffen?
Ich habe einen Forschungsstudenten mit einem bestimmten Problem beraten und wollte unbedingt die Meinung anderer auf dieser Website einholen. Kontext: Der Forscher hatte drei Arten von Prädiktorvariablen. Jeder Typ enthielt eine andere Anzahl von Prädiktorvariablen. Jeder Prädiktor war eine kontinuierliche Variable: Soziales: S1, S2, S3, S4 (dh vier Prädiktoren) Kognitiv: …
Ich habe eine Konzeptfrage zur "Grundstatistik". Als Student würde ich gerne wissen, ob ich darüber völlig falsch nachdenke und warum, wenn ja: Nehmen wir an, ich versuche hypothetisch, die Beziehung zwischen "Anger Management Issues" und Scheidung (Ja / Nein) in einer logistischen Regression zu untersuchen, und ich habe die Option, …
Ich sehe ein Regressionsmodell, das gegenüber dem Vorjahr rückläufig ist. Die Renditen der Aktienindizes sind verzögert (12 Monate). Die Renditen desselben Aktienindex, Credit Spread (Differenz zwischen dem Monatsmittel der risikofreien Anleihen und Unternehmensanleihen) sind gegenüber dem Vorjahr rückläufig Renditen), Inflationsrate im Jahresvergleich und Jahresindex der Industrieproduktion. Es sieht so aus …
Ich suche nach Methoden, mit denen sich das Messfehlermodell "OLS" abschätzen lässt. yi=Yi+ey,iyi=Yi+ey,iy_{i}=Y_{i}+e_{y,i} xi=Xi+ex,ixi=Xi+ex,ix_{i}=X_{i}+e_{x,i} Yi=α+βXiYi=α+βXiY_{i}=\alpha + \beta X_{i} Wobei die Fehler unabhängig normal sind mit unbekannten Varianzen und . "Standard" OLS funktioniert in diesem Fall nicht.σ2yσy2\sigma_{y}^{2}σ2xσx2\sigma_{x}^{2} Wikipedia hat einige unattraktive Lösungen - die beiden genannten zwingen Sie anzunehmen, dass entweder …
Ich möchte die Koeffizienten für das LASSO-Problem erhalten ||Y−Xβ||+λ||β||1.||Y−Xβ||+λ||β||1.||Y-X\beta||+\lambda ||\beta||_1. Das Problem ist, dass die Funktionen glmnet und lars unterschiedliche Antworten geben. Für die glmnet-Funktion frage ich nach den Koeffizienten von statt nur λ , aber ich bekomme immer noch andere Antworten.λ/||Y||λ/||Y||\lambda/||Y||λλ\lambda Wird das erwartet? Wie ist die Beziehung zwischen …
Welche Vor- und Nachteile hat die Verwendung von LARS [1] im Vergleich zur Verwendung der Koordinatenabsenkung für die Anpassung der L1-regulierten linearen Regression? Ich interessiere mich hauptsächlich für Leistungsaspekte (meine Probleme sind Nin der Regel Hunderttausende und p<20). Es sind jedoch auch andere Erkenntnisse erwünscht. edit: Seitdem ich die Frage …
Ich habe eine multivariate Regression, die Interaktionen einschließt. Um beispielsweise die Schätzung des Behandlungseffekts für das ärmste Quintil zu erhalten, muss ich die Koeffizienten aus dem Behandlungsregressor zu dem Koeffizienten aus der Interaktionsvariablen (die Behandlung und Quintil 1 interagiert) addieren. Wie erhält man Standardfehler, wenn man zwei Koeffizienten aus einer …
In der Vergangenheit war die schrittweise Regression in vielen biomedizinischen Veröffentlichungen überstrapaziert. Dies scheint sich jedoch durch eine bessere Aufklärung der zahlreichen Themen zu verbessern. Viele ältere Rezensenten fragen jedoch noch danach. Unter welchen Umständen spielt die schrittweise Regression eine Rolle und sollte gegebenenfalls angewendet werden?
Ich möchte den AICc eines Gratregressionsmodells berechnen. Das Problem ist die Anzahl der Parameter. Für die lineare Regression schlagen die meisten Menschen vor, dass die Anzahl der Parameter der Anzahl der geschätzten Koeffizienten plus Sigma (der Varianz des Fehlers) entspricht. Wenn es um die Gratregression geht, lese ich, dass die …
Betrachten Sie das lineare Regressionsmodell y=Xβ+uy=Xβ+u\mathbf{y}=\mathbf{X\beta}+\mathbf{u} , u∼N(0,σ2I)u∼N(0,σ2I)\mathbf{u}\sim N(\mathbf{0},\sigma^2\mathbf{I}) , E(u∣X)=0E(u∣X)=0E(\mathbf{u}\mid\mathbf{X})=\mathbf{0} . Sei vs .H 1 : σ 2 0 & ne; σ 2H0:σ20=σ2H0:σ02=σ2H_0: \sigma_0^2=\sigma^2H1:σ20≠σ2H1:σ02≠σ2H_1: \sigma_0^2\neq\sigma^2 Wir können ableiten, dass , wobei . Und ist die typische Notation für die Vernichtermatrix, , wobei die abhängige Variable ist \ mathbf {y} …
Mir ist klar, dass dieses Thema schon einige Male vorgekommen ist , aber ich bin mir immer noch unsicher, wie ich meine Regressionsergebnisse am besten interpretieren kann. Ich habe einen sehr einfachen Datensatz, bestehend aus einer Spalte mit x-Werten und einer Spalte mit y-Werten , aufgeteilt in zwei Gruppen nach …
Ich habe gelesen, dass das Gruppen-Lasso für die Variablenauswahl und die Sparsamkeit in einer Gruppe von Variablen verwendet wird. Ich möchte die Intuition hinter dieser Behauptung kennen. Warum wird Gruppenlasso dem Lasso vorgezogen? Warum ist der Lösungsweg des Gruppen-Lassos nicht stückweise linear?
Dies ist eine Frage zu einer Praxis oder Methode, die von einigen meiner Kollegen befolgt wird. Bei der Erstellung eines logistischen Regressionsmodells habe ich gesehen, dass Personen kategoriale Variablen (oder fortlaufende Variablen, die in Gruppen zusammengefasst sind) durch ihre jeweilige Beweiskraft (Weight of Evidence, WoE) ersetzen. Dies soll eine monotone …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.