Ich lese die Bücher über lineare Regression. Es gibt einige Sätze zur L1- und L2-Norm. Ich kenne sie, verstehe nur nicht, warum L1-Norm für spärliche Modelle. Kann jemand eine einfache Erklärung geben?
Ich verstehe, dass eine stationäre Zeitreihe eine ist, deren Mittelwert und Varianz über die Zeit konstant ist. Kann jemand bitte erklären, warum wir sicherstellen müssen, dass unser Datensatz stationär ist, bevor wir verschiedene ARIMA- oder ARM-Modelle darauf ausführen können? Gilt dies auch für normale Regressionsmodelle, bei denen Autokorrelation und / …
ANOVA entspricht einer linearen Regression unter Verwendung geeigneter Dummy-Variablen. Die Schlussfolgerungen bleiben gleich, unabhängig davon, ob Sie ANOVA oder lineare Regression verwenden. Gibt es im Lichte ihrer Äquivalenz einen Grund, warum ANOVA anstelle der linearen Regression verwendet wird? Hinweis: Ich bin besonders daran interessiert, technische Gründe für die Verwendung von …
In einem kürzlich abgehaltenen Kolloquium behauptete die Zusammenfassung des Redners, sie würden maschinelles Lernen anwenden. Während des Vortrags bestand das einzige, was mit maschinellem Lernen zu tun hatte, darin, dass sie eine lineare Regression ihrer Daten durchführen. Nach der Berechnung der Best-Fit-Koeffizienten im 5D-Parameterraum verglichen sie diese Koeffizienten in einem …
Was bedeutet im Allgemeinen, dass der Bruchteil der Varianz in einer Analyse wie PCA durch die erste Hauptkomponente erklärt wird? Kann jemand dies intuitiv erklären, aber auch eine genaue mathematische Definition dessen geben, was "erklärte Varianz" im Sinne der Hauptkomponentenanalyse (PCA) bedeutet?xxx Für eine einfache lineare Regression wird das R-Quadrat …
Ich hatte eine Frage zur Interpretation der durch plot (lm) in R erzeugten Graphen. Ich habe mich gefragt, ob Sie mir sagen können, wie die Diagramme für die Skalenposition und die Hebelwirkung für die verbleibenden Graphen zu interpretieren sind. Über Kommentare würde ich mich freuen. Grundkenntnisse in Statistik, Regression und …
Das Wiki diskutiert die Probleme, die auftreten, wenn Multikollinearität ein Problem in der linearen Regression ist. Das Grundproblem ist, dass Multikollinearität zu instabilen Parameterschätzungen führt, was es sehr schwierig macht, die Auswirkung unabhängiger Variablen auf abhängige Variablen zu bewerten. Ich verstehe die technischen Gründe für die Probleme (möglicherweise kann , …
Gilt es jemals, eine bidirektionale Interaktion in ein Modell aufzunehmen, ohne die Haupteffekte einzubeziehen? Was ist, wenn es bei Ihrer Hypothese nur um die Interaktion geht, müssen Sie dann noch die Haupteffekte berücksichtigen?
Unter welchen Umständen sollte man die Verwendung von Regularisierungsmethoden (Ridge, Lasso oder Least Angles Regression) anstelle von OLS in Betracht ziehen? Falls dies hilft, die Diskussion zu steuern, ist mein Hauptinteresse die Verbesserung der Vorhersagegenauigkeit.
Schauen Sie sich dieses Excel-Diagramm an: Die Best-Fit-Linie für den gesunden Menschenverstand scheint eine fast vertikale Linie zu sein, die direkt durch die Mitte der Punkte verläuft (von Hand in Rot bearbeitet). Die von Excel festgelegte lineare Trendlinie ist jedoch die dargestellte diagonale schwarze Linie. Warum hat Excel etwas produziert, …
Ich bin ziemlich oft auf den Begriff "geschlossene Lösung" gestoßen. Was bedeutet eine geschlossene Lösung? Wie kann man feststellen, ob es für ein bestimmtes Problem eine formschlüssige Lösung gibt? Bei der Online-Suche habe ich einige Informationen gefunden, aber nichts im Zusammenhang mit der Entwicklung eines statistischen oder probabilistischen Modells / …
Okay, ich denke, ich habe eine ausreichend gute Stichprobe, unter Berücksichtigung der 20: 1-Faustregel: eine ziemlich große Stichprobe (N = 374) für insgesamt 7 Kandidaten-Prädiktorvariablen. Mein Problem ist das Folgende: Unabhängig davon, welchen Satz von Prädiktorvariablen ich verwende, werden die Klassifikationen nie besser als eine Spezifität von 100% und eine …
Für ein Prognoseintervall in der linearen Regression verwenden Sie noch E [ Y | x ] = ^ β 0 + β 1 x das Intervall zu erzeugen. Sie verwenden dies auch, um ein Konfidenzintervall von E [ Y | zu generieren x 0 ] . Was ist der Unterschied …
Ich bin daran interessiert, die Fläche unter der Kurve (AUC) oder die c-Statistik von Hand für ein binäres logistisches Regressionsmodell zu berechnen. Zum Beispiel habe ich im Validierungsdatensatz den wahren Wert für die abhängige Variable, Aufbewahrung (1 = beibehalten; 0 = nicht beibehalten), sowie einen vorhergesagten Aufbewahrungsstatus für jede Beobachtung, …
We use cookies and other tracking technologies to improve your browsing experience on our website,
to show you personalized content and targeted ads, to analyze our website traffic,
and to understand where our visitors are coming from.
By continuing, you consent to our use of cookies and other tracking technologies and
affirm you're at least 16 years old or have consent from a parent or guardian.