Statistiken und Big Data regression

4

Ist es sinnvoll, einem Modell einen quadratischen, nicht aber einen linearen Term hinzuzufügen?

Ich habe ein (gemischtes) Modell, in dem einer meiner Prädiktoren (aufgrund der experimentellen Manipulation) von vornherein nur quadratisch mit dem Prädiktor in Beziehung stehen sollte. Daher möchte ich dem Modell nur den quadratischen Term hinzufügen. Zwei Dinge hindern mich daran: Ich glaube, ich habe irgendwo gelesen, dass Sie beim Anpassen …

57 regression polynomial

2

Bayes-Regression: Wie wird sie im Vergleich zur Standard-Regression durchgeführt?

Ich habe einige Fragen zur Bayes'schen Regression: Bei einer Standardregression als y=β0+β1x+εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilon . Wenn ich dies in eine Bayes'sche Regression umwandeln möchte, benötige ich vorherige Verteilungen sowohl für β0β0\beta_0 als auch für β1β1\beta_1 (oder funktioniert das nicht so)? In der Standardregression würde man …

57 regression bayesian

6

Die L2-Regularisierung entspricht dem Gaußschen Prior

Ich lese dies weiter und ich kann es intuitiv sehen, aber wie geht man von der L2-Regularisierung zu der Aussage, dass dies analytisch ein Gaußscher Prior ist? Gleiches gilt für die Aussage, dass L1 einem Laplace-Prior entspricht. Weitere Hinweise wären toll.

56 regression references regularization

1

Die logistische Regression in R führte zu einer perfekten Trennung (Hauck-Donner-Phänomen). Was jetzt?

Ich versuche, ein binäres Ergebnis unter Verwendung von 50 kontinuierlichen erklärenden Variablen vorherzusagen (der Bereich der meisten Variablen ist bis ). Mein Datensatz enthält fast 24.000 Zeilen. Wenn ich in R renne, bekomme ich:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically 0 or 1 …

56 r regression logistic separation

2

Eine genauere Diskussion der Variablenauswahl

Hintergrund Ich mache klinische Forschung in der Medizin und habe mehrere Statistikkurse besucht. Ich habe noch nie eine Arbeit mit linearer / logistischer Regression veröffentlicht und möchte die Variablenauswahl korrekt durchführen. Interpretierbarkeit ist wichtig, also keine ausgefallenen maschinellen Lerntechniken. Ich habe mein Verständnis der Variablenauswahl zusammengefasst. Würde es jemandem etwas …

55 regression feature-selection model-selection

6

Alternativen zur logistischen Regression in R

Ich möchte so viele Algorithmen, die die gleiche Aufgabe wie die logistische Regression ausführen. Das sind Algorithmen / Modelle, die eine Vorhersage für eine binäre Antwort (Y) mit einer erklärenden Variablen (X) geben können. Ich würde mich freuen, wenn Sie nach dem Namen des Algorithmus auch zeigen würden, wie er …

55 r regression logistic classification predictive-models

5

Ist es eine gute Idee, die p-Werte in einer multiplen Regression für multiple Vergleiche anzupassen?

Nehmen wir an, Sie sind ein sozialwissenschaftlicher Forscher / Ökonometriker, der versucht, relevante Prädiktoren für die Nachfrage nach einer Dienstleistung zu finden. Sie haben 2 ergebnis- / abhängige Variablen, die den Bedarf beschreiben (unter Verwendung des Dienstes yes / no und der Anzahl der Fälle). Sie haben 10 Prädiktor- / …

54 regression multivariate-analysis predictive-models multiple-regression multiple-comparisons

3

Multivariate lineare Regression gegen neuronales Netz?

In einigen Fällen scheint es möglich zu sein, ähnliche Ergebnisse wie bei einem neuronalen Netzwerk mit einer multivariaten linearen Regression zu erzielen, und die multivariate lineare Regression ist superschnell und einfach. Unter welchen Umständen können neuronale Netze bessere Ergebnisse liefern als multivariate lineare Regression?

54 regression multiple-regression neural-networks

3

Gibt es eine Box-Cox-ähnliche Transformation für unabhängige Variablen? Das heißt, eine Transformation, die die Variable so optimiert , dass sie für ein lineares Modell angemessener ist?Xxxy~f(x) Wenn ja, gibt es eine Funktion, mit der dies durchgeführt werden kann R?

53 r regression data-transformation normality-assumption

6

Effiziente lineare Online-Regression

Ich analysiere einige Daten, bei denen ich eine normale lineare Regression durchführen möchte. Dies ist jedoch nicht möglich, da ich es mit einer Online-Einstellung mit einem kontinuierlichen Strom von Eingabedaten zu tun habe (die schnell zu groß für Speicher werden) und benötigt um Parameterschätzungen zu aktualisieren, während diese verbraucht werden. …

53 time-series regression algorithms real-time

2

Was bedeutet „konstante Varianz“ in einem linearen Regressionsmodell?

Was bedeutet "konstante Varianz" im Fehlerbegriff? Aus meiner Sicht haben wir Daten mit einer abhängigen Variablen und einer unabhängigen Variablen. Konstante Varianz ist eine der Annahmen der linearen Regression. Ich frage mich, was Homoskedastizität bedeutet. Denn selbst wenn ich 500 Zeilen hätte, hätte ich einen einzigen Varianzwert, der offensichtlich konstant …

53 regression heteroscedasticity

3

Warum kümmern wir uns so sehr um normalverteilte Fehlerterme (und Homoskedastizität) in der linearen Regression, wenn wir das nicht müssen?

Ich nehme an, dass ich jedes Mal frustriert bin, wenn ich jemanden sagen höre, dass die Nichtnormalität von Residuen und / oder Heteroskedastizität gegen die OLS-Annahmen verstößt. Zur Schätzung von Parametern in einem OLS-Modell ist nach dem Gauß-Markov-Theorem keine dieser Annahmen erforderlich. Ich verstehe, wie wichtig dies beim Testen von …

52 regression assumptions normality-assumption robust teaching

5

Muss der Zielwert zusätzlich zu den Skalierungsfunktionen für die Regressionsanalyse skaliert werden?

Ich baue Regressionsmodelle. Als Vorverarbeitungsschritt skaliere ich meine Merkmalswerte auf Mittelwert 0 und Standardabweichung 1. Müssen die Zielwerte auch normalisiert werden?

52 regression machine-learning

4

Warum nicht durch Regression an die Klassifikation herangehen?

Einige Materialien, die ich beim maschinellen Lernen gesehen habe, sagten, es sei eine schlechte Idee, ein Klassifizierungsproblem durch Regression anzugehen. Aber ich denke, es ist immer möglich, eine kontinuierliche Regression durchzuführen, um die Daten anzupassen und die kontinuierliche Vorhersage abzuschneiden, um diskrete Klassifizierungen zu erhalten. Warum ist es eine schlechte …

51 regression machine-learning classification

3

Kann eine zufällige Gesamtstruktur für die Feature-Auswahl in der multiplen linearen Regression verwendet werden?

Da RF mit Nichtlinearität umgehen kann, aber keine Koeffizienten bereitstellt, ist es ratsam, Zufallsgesamtstrukturen zu verwenden, um die wichtigsten Merkmale zu erfassen und diese Merkmale dann in ein Modell mit mehreren linearen Regressionen zu integrieren, um ihre Koeffizienten zu erhalten.

50 regression machine-learning feature-selection random-forest regression-strategies

Als «regression» getaggte Fragen