Als «linear» getaggte Fragen

Für statistische Themen, bei denen Linearität angenommen wird, z. B. lineare Regression oder lineare gemischte Modelle, oder für die Diskussion der linearen Algebra in der Statistik.


5
Wann wird ein Mischeffektmodell verwendet?
Modelle mit linearen gemischten Effekten sind Erweiterungen von linearen Regressionsmodellen für Daten, die in Gruppen gesammelt und zusammengefasst werden. Der Hauptvorteil ist, dass die Koeffizienten in Bezug auf eine oder mehrere Gruppenvariablen variieren können. Ich habe jedoch Probleme damit, wann ich ein Mischeffektmodell verwenden soll. Ich werde meine Fragen anhand …


2
Einfache lineare Regression in Keras
Nachdem ich mir diese Frage angesehen habe: Beim Versuch, die lineare Regression mit Keras zu emulieren , habe ich versucht, mein eigenes Beispiel nur zu Studienzwecken zu erstellen und meine Intuition zu entwickeln. Ich habe einen einfachen Datensatz heruntergeladen und eine Spalte verwendet, um eine andere vorherzusagen. Die Daten sehen …


4
Wie interpretiere ich eine Überlebenskurve des Cox-Hazard-Modells?
Wie interpretieren Sie eine Überlebenskurve aus dem Cox-Proportional-Hazard-Modell? Nehmen wir in diesem Spielzeugbeispiel an, wir haben ein Cox-Proportional-Hazard-Modell für ageVariablen in kidneyDaten und generieren die Überlebenskurve. library(survival) fit <- coxph(Surv(time, status)~age, data=kidney) plot(conf.int="none", survfit(fit)) grid() Welche Aussage ist zum Zeitpunkt zum Beispiel wahr? oder sind beide falsch?200200200 Statement 1: Wir …

2
Lineare Kombination von zwei zufälligen Nicht-Normalen, die immer noch zur selben Familie gehören
Es ist bekannt, dass eine lineare Kombination von 2 zufälligen Normalvariablen auch eine zufällige Normalvariable ist. Gibt es gemeinsame nicht normale Verteilungsfamilien (z. B. Weibull), die diese Eigenschaft ebenfalls teilen? Es scheint viele Gegenbeispiele zu geben. Beispielsweise ist eine lineare Kombination von Uniformen typischerweise nicht einheitlich. Gibt es insbesondere nicht …

2
Ist es möglich, eine logistische Regression ohne Zufälligkeit zu simulieren?
Wir können eine lineare Regression ohne Zufälligkeit simulieren, was bedeutet, dass wir y=Xβy=Xβy=X\beta anstelle von y=Xβ+ϵy=Xβ+ϵy=X\beta+\epsilon . Wenn wir dann ein lineares Modell anpassen, sind die Koeffizienten identisch mit der "Grundwahrheit". Hier ist ein Beispiel. set.seed(0) n <- 1e5 p <- 3 X <- matrix(rnorm(n*p), ncol=p) beta <- runif(p) # …

3
Finden Sie die Verteilung und transformieren Sie sie in die Normalverteilung
Ich habe Daten, die beschreiben, wie oft ein Ereignis während einer Stunde stattfindet ("Anzahl pro Stunde", nph) und wie lange die Ereignisse dauern ("Dauer in Sekunden pro Stunde", dph). Dies sind die Originaldaten: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, 9.21739130425452, 27.8399999994814, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

1
Erwarteter Wert und Varianz der Schätzung des Steigungsparameters
Ich lese einen Text, "Wahrscheinlichkeit und Statistik" von Devore. Ich betrachte 2 Punkte auf Seite 740: den erwarteten Wert und die Varianz der Schätzung von β1β1\beta_1 , die der Steigungsparameter in der linearen Regression Yi=β0+β1Xi+ϵiY.ich=β0+β1X.ich+ϵichY_i = \beta_0 + \beta_1 X_i + \epsilon_i . ϵiϵich\epsilon_i ist eine Gaußsche ( μ=0,variance=σ2μ=0,veinricheinnce=σ2\mu = …



2
Wie kann ich betrügerische Variablen in großen Datenmengen schnell erkennen?
Angenommen, wir haben einen Datensatz mit Millionen Zeilen und Tausenden Spalten und die Aufgabe ist die binäre Klassifizierung. Wenn wir ein logistisches Regressionsmodell ausführen, ist die Leistung viel besser als erwartet, z. B. eine nahezu perfekte Klassifizierung. Wir vermuten, dass die Daten einige betrügerische Variablen enthalten. Wie kann ich sie …

3
GLMs müssen in den Parametern linear sein.
Ich habe eine gewisse kognitive Dissonanz darüber, was "linear in den Parametern" bedeutet. Zum Beispiel hier und hier . Zum Beispiel ist mein Verständnis ist in den Parametern nicht linear, da zwei Parametervariablen miteinander multipliziert sind (nämlich ).yich=β0+β1β2x1+ exp(β3) (x2)2+ ϵyi=β0+β1β2x1+exp⁡(β3)(x2)2+ϵy_i = \beta_0 + \beta_1\beta_2x_1 + \exp(\beta_3)(x_2)^2 + \epsilonβ1,β2β1,β2{\beta_1, \beta_2} …

3
Ist OLS der häufigere Ansatz zur linearen Regression?
In diesem Wikipedia-Artikel gibt es diesen Satz: Dies ist ein häufiger Ansatz Bezieht sich das auf OLS? Ist es wirklich eher ein "als" das "? Was sind andere häufigere Ansätze? Soweit ich weiß, müssen wir minimieren [ε1,ε2,...,εnε1,ε2,...,εn\varepsilon_1, \varepsilon_2, ..., \varepsilon_n] [ε1,ε2,...,εnε1,ε2,...,εn\varepsilon_1, \varepsilon_2, ..., \varepsilon_n] '. Bearbeiten: Dies ist in Bezug …
Durch die Nutzung unserer Website bestätigen Sie, dass Sie unsere Cookie-Richtlinie und Datenschutzrichtlinie gelesen und verstanden haben.
Licensed under cc by-sa 3.0 with attribution required.