Worum geht es?
Das Wissen über Techniken ist mit dem Kennen der Tiere in einem Zoo vergleichbar - Sie können sie benennen, ihre Eigenschaften beschreiben und sie möglicherweise in freier Wildbahn identifizieren.
Zu verstehen, wann sie zu verwenden sind, mathematische Modelle innerhalb eines Anwendungsbereichs zu formulieren, zu erstellen, zu testen und zu implementieren, während die Fallstricke vermieden werden - dies sind meiner Meinung nach die Fähigkeiten, die sich auszeichnen.
Der Schwerpunkt sollte auf der Wissenschaft liegen und einen systematischen wissenschaftlichen Ansatz für geschäftliche, industrielle und kommerzielle Probleme verfolgen. Dies erfordert jedoch Fähigkeiten, die umfassender sind als Data Mining und maschinelles Lernen, wie Robin Bloor in "A Data Science Rant" überzeugend argumentiert .
Was kann man also tun?
Anwendungsbereiche : Informieren Sie sich über verschiedene Anwendungsbereiche, die Ihrem Interesse oder dem Ihres Arbeitgebers entsprechen. Der Bereich ist oft weniger wichtig, als zu verstehen, wie das Modell erstellt wurde und wie es verwendet wurde, um diesem Bereich einen Mehrwert zu verleihen. Modelle, die in einem Bereich erfolgreich sind, können häufig transplantiert und auf verschiedene Bereiche angewendet werden, die auf ähnliche Weise funktionieren.
Wettbewerbe : Probieren Sie die Website des Data Mining-Wettbewerbs Kaggle aus und schließen Sie sich vorzugsweise einem Team von anderen an. (Kaggle: Plattform für Vorhersagemodellierungswettbewerbe. Unternehmen, Regierungen und Forscher präsentieren Datensätze und Probleme, und die weltbesten Datenwissenschaftler konkurrieren um die besten Lösungen.)
Grundlagen : Es gibt vier: (1) solide Grundlagen in der Statistik, (2) einigermaßen gute Programmierkenntnisse, (3) Verständnis für die Strukturierung komplexer Datenabfragen, (4) Erstellen von Datenmodellen. Wenn jemand schwach ist, ist dies ein wichtiger Ausgangspunkt.
Ein paar Zitate dazu:
„Ich habe sehr früh den Unterschied zwischen dem Namen von etwas und etwas gelernt. Sie können den Namen eines Vogels in allen Sprachen der Welt kennen, aber wenn Sie fertig sind, wissen Sie absolut nichts über den Vogel ... Schauen wir uns den Vogel an und sehen, was er tut - das ist es Was zählt. '' - Richard Feynman, "The Making of a Scientist", S. 14 in Was interessiert Sie, was andere Leute denken, 1988
Merken Sie sich:
`` Die Kombination der Fähigkeiten, die für die Durchführung dieser Business-Science- Projekte (Data-Science-Projekte) erforderlich sind, befindet sich selten in einer Person. Jemand hätte in der Tat umfassende Kenntnisse in den drei Bereichen (i) der Geschäftstätigkeit, (ii) der Verwendung von Statistiken und (iii) der Verwaltung von Daten und Datenflüssen erlangen können. In diesem Fall könnte er oder sie tatsächlich behaupten, ein Wirtschaftswissenschaftler (auch bekannt als „Datenwissenschaftler“) in einem bestimmten Sektor zu sein. Aber solche Individuen sind fast so selten wie die Zähne von Hühnern. “- Robin Bloor, A Data Science Rant , August 2013, Inside Analysis
Und schlussendlich:
"Die Karte ist nicht das Territorium." - Alfred Korzybski, 1933, Science & Sanity.
Die meisten realen, angewandten Probleme sind nicht nur über die Karte zugänglich. Um mit der mathematischen Modellierung praktische Dinge zu tun, muss man bereit sein, sich mit Details, Feinheiten und Ausnahmen abzufinden. Nichts kann es ersetzen, das Gebiet aus erster Hand zu kennen.