Lassen Sie mich zunächst klarstellen, dass ich meine Reise in die Datenwissenschaft vom Standpunkt eines Programmierers und Datenbankentwicklers aus beginne. Ich bin weder ein 10-jähriger Experte für Datenwissenschaften noch ein statistischer Gott. Ich arbeite jedoch als Data Scientist und mit großen Datenmengen für ein Unternehmen, das mit relativ großen Kunden weltweit zusammenarbeitet.
Nach meiner Erfahrung verwenden Data Scientist alle Tools, die sie zur Erledigung ihrer Aufgaben benötigen. Excel, R, SAS, Python und mehr sind alles Werkzeuge in einer Toolbox für gute Datenwissenschaftler. Die Besten können eine Vielzahl von Tools verwenden, um Daten zu analysieren und zu analysieren.
Wenn Sie also feststellen, dass Sie R mit Python vergleichen, machen Sie wahrscheinlich alles falsch in der Welt der Datenwissenschaft. Gute Datenwissenschaftler verwenden beides, wenn es sinnvoll ist, eines übereinander zu verwenden. Dies gilt auch für Excel.
Ich denke, dass es ziemlich schwierig ist, jemanden zu finden, der Erfahrung in so vielen verschiedenen Werkzeugen und Sprachen hat, während er in allem großartig war. Ich denke auch, dass es schwierig sein wird, einen Datenwissenschaftler zu finden, der nicht nur komplexe Algorithmen programmieren kann, sondern auch weiß, wie man sie vom statistischen Standpunkt aus verwendet.
Die meisten Datenwissenschaftler, mit denen ich zusammengearbeitet habe, haben ungefähr zwei Geschmacksrichtungen. Diejenigen, die programmieren können und die, die nicht können. Ich arbeite selten mit Datenwissenschaftlern zusammen, die Daten in Python abrufen, sie mit Pandas bearbeiten, ein Modell an die Daten in R anpassen und sie dann Ende der Woche dem Management vorlegen können.
Ich meine, ich weiß, dass sie existieren. Ich habe viele Data Science-Blogs von Leuten gelesen, die Web-Scrapper entwickelt, in Hadoop gepusht, in Python wiederhergestellt, komplexe Dinge programmiert und zum Booten in R ausgeführt haben. Sie existieren. Sie sind da draußen. Ich habe einfach nicht zu viele getroffen, die all das können. Vielleicht ist es aber nur meine Gegend?
Heißt das also, sich nur auf eine Sache zu spezialisieren, die schlecht ist? Viele meiner Freunde sind auf nur eine Hauptsprache spezialisiert und töten sie. Ich kenne viele Daten-Leute, die nur R kennen und es töten. Ich kenne auch viele Leute, die Excel nur zum Analysieren von Daten verwenden, da dies das einzige ist, was ein Nicht-Datenwissenschaftler öffnen und verwenden kann (insbesondere in B2B-Unternehmen). Die Frage, die Sie wirklich beantworten müssen, ist, ob dies die EINE ist, die Sie für diese Position benötigen. Und vor allem, können sie neue Dinge lernen?
PS
Data Science beschränkt sich nicht nur auf "BIG DATA" oder NoSQL.