Es gibt eine Reihe von Websites, die den Gradientenabstieg beschreiben, um die Parameter für die einfache lineare Regression zu finden ( hier ist einer davon). Google beschreibt es auch in ihrem neuen (für die Öffentlichkeit) ML-Kurs.
Jedoch auf Wikipedia , die folgenden Formeln , die Parameter zur Berechnung
Außerdem hat die Scikit-Learn- LinearRegression- Funktion kein n_iter_
Attribut (Anzahl der Iterationen) wie viele andere Lernfunktionen, was vermutlich darauf hindeutet, dass der Gradientenabstieg nicht verwendet wird.
Fragen:
- Beschreiben die Websites, die den Gradientenabstieg für eine einfache lineare Regression beschreiben, dies nur, um das Konzept anhand des grundlegendsten ML-Modells zu vermitteln? Entspricht die Formel auf Wikipedia den meisten Statistiksoftware zur Berechnung der Parameter (zumindest scheint Scikit-Learn keinen Gradientenabstieg zu verwenden)?
- Was wird normalerweise für die multiple lineare Regression verwendet?
- Für welche Arten von statistischen Lernmodellen wird der Gradientenabstieg normalerweise verwendet, um die Parameter gegenüber anderen Methoden zu ermitteln? Dh gibt es eine Faustregel?