Meine Frage ergibt sich aus der folgenden Tatsache. Ich habe Beiträge, Blogs, Vorträge sowie Bücher über maschinelles Lernen gelesen. Mein Eindruck ist, dass Praktiker des maschinellen Lernens vielen Dingen, die Statistiker / Ökonometrie interessieren, gleichgültig gegenüberstehen. Insbesondere betonen Praktiker des maschinellen Lernens die Vorhersagegenauigkeit gegenüber der Inferenz.
Ein solches Beispiel trat auf, als ich Andrew Ngs maschinelles Lernen auf Coursera nahm. Bei der Erörterung des einfachen linearen Modells erwähnte er nichts über die BLAUE Eigenschaft der Schätzer oder darüber, wie Heteroskedastizität das Konfidenzintervall "ungültig machen" würde. Stattdessen konzentriert er sich auf die Implementierung des Gradientenabfalls und das Konzept der Kreuzvalidierung / ROC-Kurve. Diese Themen wurden in meinen Kursen zu Ökonometrie / Statistik nicht behandelt.
Ein weiteres Beispiel war die Teilnahme an Kaggle-Wettbewerben. Ich habe den Code und die Gedanken anderer Leute gelesen. Ein großer Teil der Teilnehmer wirft einfach alles in SVM / Random Forest / XGBoost.
Ein weiteres Beispiel ist die schrittweise Modellauswahl. Diese Technik ist weit verbreitet, zumindest online und bei Kaggle. Viele klassische Lehrbücher für maschinelles Lernen behandeln dies ebenfalls, beispielsweise die Einführung in das statistische Lernen. Nach dieser Antwort (die ziemlich überzeugend ist) ist die schrittweise Modellauswahl jedoch mit vielen Problemen verbunden, insbesondere wenn es darum geht, "das wahre Modell zu entdecken". Es scheint nur zwei Möglichkeiten zu geben: Entweder kennen Praktiker des maschinellen Lernens das Problem nicht schrittweise, oder sie tun es, aber es ist ihnen egal.
Also hier sind meine Fragen:
- Stimmt es, dass sich (im Allgemeinen) Praktiker des maschinellen Lernens auf die Vorhersage konzentrieren und sich daher nicht um viele Dinge kümmern, die Statistiker / Ökonomen interessieren?
- Wenn es wahr ist, was ist dann der Grund dafür? Liegt es daran, dass Inferenz in gewissem Sinne schwieriger ist?
- Es gibt Unmengen von Materialien zum maschinellen Lernen (oder zur Vorhersage) online. Wenn ich jedoch etwas über Inferenz lernen möchte, welche Online-Ressourcen kann ich konsultieren?
Update : Ich habe gerade festgestellt, dass das Wort "Inferenz" möglicherweise viele Dinge bedeuten kann. Was ich mit "Inferenz" gemeint habe, bezieht sich auf Fragen wie
Da "alle Modelle falsch sind", wie "falsch" ist unser Modell vom wahren Modell?
Was können wir angesichts der Informationen einer Stichprobe über die Bevölkerung sagen und wie sicher können wir das sagen?
Aufgrund meiner sehr begrenzten statistischen Kenntnisse bin ich mir nicht einmal sicher, ob diese Fragen in den Bereich der Statistik fallen oder nicht. Aber das sind die Arten von Fragen, die den Praktikern des maschinellen Lernens nicht wichtig zu sein scheinen. Vielleicht kümmern sich Statistiker auch nicht darum? Ich weiß es nicht.
fortunes
CRAN-Pakets geworden. Dies nur um zu sagen, Sie sind nicht allein mit dem Eindruck, dass mathematische Strenge nicht immer das Hauptanliegen beim maschinellen Lernen ist.