Für statistische Themen, bei denen Linearität angenommen wird, z. B. lineare Regression oder lineare gemischte Modelle, oder für die Diskussion der linearen Algebra in der Statistik.
Nehmen wir an, wir haben einen Zufallsvektor , der aus einer Verteilung mit der Wahrscheinlichkeitsdichtefunktion f → X ( → x ) gezogen wird . Wenn wir es linear durch eine n × n- Matrix A mit vollem Rang transformieren , um → Y = A → X zu erhalten …
Modelle mit linearen gemischten Effekten sind Erweiterungen von linearen Regressionsmodellen für Daten, die in Gruppen gesammelt und zusammengefasst werden. Der Hauptvorteil ist, dass die Koeffizienten in Bezug auf eine oder mehrere Gruppenvariablen variieren können. Ich habe jedoch Probleme damit, wann ich ein Mischeffektmodell verwenden soll. Ich werde meine Fragen anhand …
Wenn wir Parameter der linearen Regression schätzen wollen, machen wir normale Gleichungen, so viele wie das lineare Modell die Anzahl der Unbekannten enthält. Warum heißen diese Gleichungen Normalgleichungen?
Nachdem ich mir diese Frage angesehen habe: Beim Versuch, die lineare Regression mit Keras zu emulieren , habe ich versucht, mein eigenes Beispiel nur zu Studienzwecken zu erstellen und meine Intuition zu entwickeln. Ich habe einen einfachen Datensatz heruntergeladen und eine Spalte verwendet, um eine andere vorherzusagen. Die Daten sehen …
Mein - Datensatz ( N.≈ 10 , 000N.≈10,000N \approx 10,000 ) eine abhängige Variable (DV), fünf unabhängige "Baseline" Variablen (P1, P2, P3, P4, P5) und eine unabhängige Variable von Interesse (Q). Ich habe lineare OLS-Regressionen für die folgenden zwei Modelle ausgeführt: DV ~ 1 + P1 + P2 + P3 …
Wie interpretieren Sie eine Überlebenskurve aus dem Cox-Proportional-Hazard-Modell? Nehmen wir in diesem Spielzeugbeispiel an, wir haben ein Cox-Proportional-Hazard-Modell für ageVariablen in kidneyDaten und generieren die Überlebenskurve. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Welche Aussage ist zum Zeitpunkt zum Beispiel wahr? oder sind beide falsch?200200200 Statement 1: Wir …
Es ist bekannt, dass eine lineare Kombination von 2 zufälligen Normalvariablen auch eine zufällige Normalvariable ist. Gibt es gemeinsame nicht normale Verteilungsfamilien (z. B. Weibull), die diese Eigenschaft ebenfalls teilen? Es scheint viele Gegenbeispiele zu geben. Beispielsweise ist eine lineare Kombination von Uniformen typischerweise nicht einheitlich. Gibt es insbesondere nicht …
Wir können eine lineare Regression ohne Zufälligkeit simulieren, was bedeutet, dass wir y=Xβy=Xβy=X\beta anstelle von y=Xβ+ϵy=Xβ+ϵy=X\beta+\epsilon . Wenn wir dann ein lineares Modell anpassen, sind die Koeffizienten identisch mit der "Grundwahrheit". Hier ist ein Beispiel. set.seed(0) n <- 1e5 p <- 3 X <- matrix(rnorm(n*p), ncol=p) beta <- runif(p) # …
Ich habe Daten, die beschreiben, wie oft ein Ereignis während einer Stunde stattfindet ("Anzahl pro Stunde", nph) und wie lange die Ereignisse dauern ("Dauer in Sekunden pro Stunde", dph). Dies sind die Originaldaten: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, …
Ich lese einen Text, "Wahrscheinlichkeit und Statistik" von Devore. Ich betrachte 2 Punkte auf Seite 740: den erwarteten Wert und die Varianz der Schätzung von β1β1\beta_1 , die der Steigungsparameter in der linearen Regression Yi=β0+β1Xi+ϵiY.ich=β0+β1X.ich+ϵichY_i = \beta_0 + \beta_1 X_i + \epsilon_i . ϵiϵich\epsilon_i ist eine Gaußsche ( μ=0,variance=σ2μ=0,veinricheinnce=σ2\mu = …
Ich weiß, dass dies das Lösungssystem des linearen Gleichungsproblems ist. Aber meine Frage ist, warum es ein Problem ist, dass die Anzahl der Beobachtungen geringer ist als die Anzahl der Prädiktoren. Wie kann das passieren? Kommt die Datenerfassung nicht aus dem heiklen Umfragedesign oder dem experimentellen Design, sofern sie zumindest …
Ich versuche zu verstehen, wie Menschen die Wahrscheinlichkeit für eine einfache lineare Regression ableiten. Nehmen wir an, wir haben nur ein Merkmal x und das Ergebnis y. Ich bezweifle nicht den Ausdruck mit der normalen Dichte selbst und ich bezweifle auch nicht, dass man das Produkt aufgrund der Unabhängigkeit in …
Angenommen, wir haben einen Datensatz mit Millionen Zeilen und Tausenden Spalten und die Aufgabe ist die binäre Klassifizierung. Wenn wir ein logistisches Regressionsmodell ausführen, ist die Leistung viel besser als erwartet, z. B. eine nahezu perfekte Klassifizierung. Wir vermuten, dass die Daten einige betrügerische Variablen enthalten. Wie kann ich sie …
Ich habe eine gewisse kognitive Dissonanz darüber, was "linear in den Parametern" bedeutet. Zum Beispiel hier und hier . Zum Beispiel ist mein Verständnis ist in den Parametern nicht linear, da zwei Parametervariablen miteinander multipliziert sind (nämlich ).yich=β0+β1β2x1+ exp(β3) (x2)2+ ϵyi=β0+β1β2x1+exp(β3)(x2)2+ϵy_i = \beta_0 + \beta_1\beta_2x_1 + \exp(\beta_3)(x_2)^2 + \epsilonβ1,β2β1,β2{\beta_1, \beta_2} …
In diesem Wikipedia-Artikel gibt es diesen Satz: Dies ist ein häufiger Ansatz Bezieht sich das auf OLS? Ist es wirklich eher ein "als" das "? Was sind andere häufigere Ansätze? Soweit ich weiß, müssen wir minimieren [ε1,ε2,...,εnε1,ε2,...,εn\varepsilon_1, \varepsilon_2, ..., \varepsilon_n] [ε1,ε2,...,εnε1,ε2,...,εn\varepsilon_1, \varepsilon_2, ..., \varepsilon_n] '. Bearbeiten: Dies ist in Bezug …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.