Statistiken und Big Data regression

4

Anmerkung: SSTSSTSST = Summe der Quadrate insgesamt, SSESSESSE = Summe der quadrierten Fehler und SSRSSRSSR = Regressionssumme der Quadrate. Die Gleichung im Titel wird oft geschrieben als: ∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2∑i=1n(yi−y¯)2=∑i=1n(yi−y^i)2+∑i=1n(y^i−y¯)2\sum_{i=1}^n (y_i-\bar y)^2=\sum_{i=1}^n (y_i-\hat y_i)^2+\sum_{i=1}^n (\hat y_i-\bar y)^2 Ziemlich einfache Frage, aber ich suche nach einer intuitiven Erklärung. Intuitiv scheint es mir sinnvoller …

14 regression least-squares r-squared

2

So glätten Sie Daten und erzwingen Monotonie

Ich habe einige Daten, die ich glätten möchte, damit die geglätteten Punkte monoton abnehmen. Meine Daten nehmen stark ab und beginnen dann ein Plateau. Hier ist ein Beispiel mit R df <- data.frame(x=1:10, y=c(100,41,22,10,6,7,2,1,3,1)) ggplot(df, aes(x=x, y=y))+geom_line() Was ist eine gute Glättungstechnik, die ich verwenden könnte? Außerdem wäre es schön, …

14 regression smoothing

3

Tiefe neuronale Netze - Nur zur Bildklassifizierung?

Alle Beispiele, die ich mit Deep-Believe- oder Faltungs-Neuronalen Netzen gefunden habe, verwenden sie zur Bildklassifizierung, zur Erkennung von Chat-Zeichen oder zur Spracherkennung. Sind tiefe neuronale Netze auch für klassische Regressionsaufgaben nützlich, bei denen die Merkmale nicht strukturiert sind (z. B. nicht in einer Sequenz oder einem Gitter angeordnet sind)? Wenn …

14 regression machine-learning neural-networks deep-learning

1

Ich habe eine Linie, die am besten passt. Ich benötige Datenpunkte, die meine Best-Fit-Linie nicht ändern

Ich halte einen Vortrag über das Anpassen von Linien. Ich habe eine einfache lineare Funktion, y=1x+by=1x+by=1x+b . Ich versuche, verstreute Datenpunkte zu erhalten, die ich in ein Streudiagramm einfügen kann, damit meine Best-Fit-Linie der gleichen Gleichung entspricht. Ich würde diese Technik gerne in R oder Excel lernen - je nachdem, …

14 r regression least-squares excel

3

Splines gegen Gaußsche Prozessregression

Ich weiß, dass die Gaußsche Prozessregression (GPR) eine Alternative zur Verwendung von Splines zur Anpassung flexibler nichtlinearer Modelle ist. Ich würde gerne wissen, in welchen Situationen eine besser geeignet ist als die andere, insbesondere im Rahmen der Bayes'schen Regression. Ich habe bereits nachgesehen. Was sind die Vor- / Nachteile der …

14 regression gaussian-process splines kriging

1

Warum lösen Modelle mit gemischten Effekten die Abhängigkeit auf?

Angenommen, wir sind daran interessiert, wie sich die Noten der Schülerprüfungen auf die Anzahl der Stunden auswirken, die diese Schüler studieren. Um diese Beziehung zu untersuchen, könnten wir die folgende lineare Regression durchführen: exam.gradesi=a+β1×hours.studiedi+eiexam.gradesi=a+β1×hours.studiedi+ei \text{exam.grades}_i = a + \beta_1 \times \text{hours.studied}_i + e_i Wenn wir jedoch Schüler aus mehreren verschiedenen …

14 regression mixed-model random-effects-model non-independent

2

GLM: Überprüfung der Verteilungs- und Link-Funktion

Ich habe ein verallgemeinertes lineares Modell, das eine Gaußsche Verteilungs- und Protokollverknüpfungsfunktion anwendet. Nach dem Anpassen des Modells überprüfe ich die Residuen: QQ-Diagramm, Residuen gegen vorhergesagte Werte, Histogramm der Residuen (unter Berücksichtigung der gebotenen Vorsicht). Alles sieht gut aus. Dies scheint mir nahezulegen, dass die Wahl einer Gaußschen Verteilung durchaus …

14 regression generalized-linear-model link-function

1

Von exp (Koeffizienten) zu Odds Ratio und deren Interpretation in Logistic Regression mit Faktoren

Ich führte eine lineare Regression der Akzeptanz im College durch, die sich nach den SAT-Werten und dem familiären / ethnischen Hintergrund richtete. Die Daten sind fiktiv. Dies ist ein Follow-up zu einer vorherigen Frage, die bereits beantwortet wurde. Die Frage konzentriert sich auf die Erfassung und Interpretation von Quotenverhältnissen, wenn …

14 r regression logistic

2

Was bedeutet es, eine Variable gegen eine andere zu regressieren?

Wenn wir sagen, um gegen X zu regressieren , meinen wir dann, dass X die unabhängige Variable und Y die abhängige Variable ist? dh Y = a X + b .YYYXXXXXXY=aX+bY=aX+bY =aX + b

14 regression terminology

5

Was genau sind zensierte Daten?

Ich habe verschiedene Beschreibungen von zensierten Daten gelesen: A) Wie in diesem Thread erläutert , werden nicht quantifizierte Daten unterhalb oder oberhalb eines bestimmten Schwellenwerts zensiert. Nicht quantifiziert bedeutet, dass die Daten einen bestimmten Schwellenwert überschreiten oder unterschreiten, der genaue Wert ist uns jedoch nicht bekannt. Die Daten werden dann …

14 regression terminology censoring

4

Bedeutet „Korrelation“ auch die Steigung in der Regressionsanalyse?

Ich lese eine Zeitung und der Autor schrieb: Die Auswirkung von A, B, C auf Y wurde mithilfe einer multiplen Regressionsanalyse untersucht. A, B, C wurden mit Y als abhängige Variable in die Regressionsgleichung eingetragen. Die Varianzanalyse ist in Tabelle 3 dargestellt. Die Wirkung von B auf Y war signifikant, …

14 regression correlation terminology

1

Was ist der Unterschied zwischen Regressionskoeffizienten und partiellen Regressionskoeffizienten?

Ich habe gelesen , in Abdi (2003) , dass Wenn die unabhängigen Variablen paarweise orthogonal sind, wird der Effekt jeder von ihnen in der Regression bewertet, indem die Steigung der Regression zwischen dieser unabhängigen Variablen und der abhängigen Variablen berechnet wird. In diesem Fall (dh Orthogonalität der IVs) sind die …

14 regression multiple-regression regression-coefficients terminology

3

Verständnis des Konfidenzbandes aus einer Polynomregression

Ich versuche, das Ergebnis zu verstehen, das ich in meiner Grafik unten sehe. Normalerweise verwende ich Excel und erhalte eine lineare Regressionslinie, aber im folgenden Fall verwende ich R und erhalte eine polynomielle Regression mit dem Befehl: ggplot(visual1, aes(ISSUE_DATE,COUNTED)) + geom_point() + geom_smooth() Meine Fragen beschränken sich also auf Folgendes: …

14 r regression data-visualization outliers

4

Kann die Random Forest-Methodik auf lineare Regressionen angewendet werden?

Random Forests erstellen ein Ensemble von Entscheidungsbäumen, wobei jeder Baum mithilfe eines Bootstrap-Beispiels der ursprünglichen Trainingsdaten (Beispiel für Eingabevariablen und Beobachtungen) erstellt wird. Kann ein ähnlicher Prozess für die lineare Regression angewendet werden? Erstellen Sie k lineare Regressionsmodelle mit einer zufälligen Bootstrap-Stichprobe für jede der k Regressionen Was sind die …

14 regression predictive-models ensemble

3

Regressionsbaumalgorithmus mit linearen Regressionsmodellen in jedem Blatt

Kurzversion: Ich suche ein R-Paket, das Entscheidungsbäume erstellen kann, während jedes Blatt im Entscheidungsbaum ein vollständiges lineares Regressionsmodell ist. AFAIK, die Bibliothek rparterstellt Entscheidungsbäume, in denen die abhängige Variable in jedem Blatt konstant ist. Gibt es eine andere Bibliothek (oder eine rpartEinstellung, die mir nicht bekannt ist), die solche Bäume …

14 r regression rpart cart

Als «regression» getaggte Fragen