Wird Software Statistiker irgendwann überflüssig machen? Was kann nicht in einen Computer programmiert werden?
Wird Software Statistiker irgendwann überflüssig machen? Was kann nicht in einen Computer programmiert werden?
Antworten:
@Adam, wenn Sie statistische Forscher analog zu jenen in anderen Bereichen betrachten - Menschen, die auf der vorhandenen Methodik und dem vorhandenen Wissen aufbauen - dann könnte dies deutlicher machen, dass die Antwort auf Ihre erste Frage "Nein" lautet.
Statistiker, die von der einfachen Anwendung von Softwarepaketen aus der Dose leben, könnten möglicherweise für jeden Schritt durch Computer ersetzt werden, es sei denn, sie schreiben den Diskussionsabschnitt eines Papiers, in dem die Ergebnisse interpretiert werden müssen. In diesem Sinne, ja - es könnte automatisiert werden (obwohl es eine komplizierte Software sein müsste, die einen verdammt natürlichen Sprachprozessor hat).
Wie die meisten Forscher jedoch irgendwann herausfinden, sind die Routinen, die die Menschen häufig anwenden, recht begrenzt und müssen modifiziert (oder neue Methoden müssen entwickelt werden) werden, um spezielle Forschungsfragen zu beantworten - hier ist der menschliche Aspekt der Statistik unverzichtbar . Oder ein Forscher muss sich einfach mit einer etwas anderen, aber verwandten Forschungsfrage begnügen, die mit klassischen Methoden beantwortet werden kann.
Die meisten Statistiker, die ich kenne, arbeiten in Forschungsberufen (z. B. Professoren, Wissenschaftler), deren Hauptaufgabe darin besteht, neue Methoden zu entwickeln. Wenn dieser Prozess automatisiert werden könnte, was bedeutet, dass ein Computer nützliche neue Methoden formulieren und entwickeln kann, dann fürchte ich, dass Forscher auf jedem Gebiet überholt wären.
Computer machen Statistiker nur dann obsolet, wenn starke KI den Menschen als Ganzes obsolet macht.
Die Frage erinnert mich an die Frage: "Wenn es all diese robusten statistischen Methoden gibt, warum wenden die Leute dann noch andere Methoden an?" Ein Teil der Antwort ist Gewohnheit und Training, aber ein Großteil davon ist, dass die Frage naiv ist: "robust" bedeutet nicht "Sie müssen nicht darüber nachdenken und verstehen, was Sie tun", wie die Frage impliziert.
Ich meine, Sie könnten heute das R-Statistikpaket herunterladen und bei Einbruch der Dunkelheit jede grundlegende statistische Technik ausführen. Sie könnten dann ein paar Pakete herunterladen und Methoden anwenden, die so esoterisch sind, dass die meisten von uns noch nicht einmal davon gehört haben. Die Frage ist: Würden Sie vernünftige Antworten bekommen? Die Antwort lautet: wahrscheinlich nicht.
Die Algorithmen sind automatisiert, aber Sie müssen auf dem gesamten Untersuchungsweg noch viele Entscheidungen treffen: vom Angriffsplan bis zur endgültigen Beurteilung, ob die Ergebnisse tatsächlich Sinn ergeben. Um an diesen Punkt zu gelangen, sprechen Sie wirklich von Star-Trek-ähnlichen Computern, auf denen Sie sagen können: "Computer, sag mir ...". An diesem Punkt ist so ziemlich jede menschliche Berufung überholt.
Was kann ein Statistiker tun, was ein Computer nicht kann? Schreiben Sie das ursprüngliche Programm, durch das sie ersetzt werden.
Abgesehen von dieser etwas albernen Antwort liegt die Wurzel der Frage darin, die eigentliche Wissenschaft der Statistik zugunsten ihrer Mechanik zu ignorieren und die Rolle des kreativen Prozesses bei der statistischen Analyse völlig zu vernachlässigen. Um das Beispiel von Peter Flom zu verwenden: Autos werden mit Nieten und Schweißnähten gebaut. Es gibt also keinen Grund, warum der neue Mustang nicht mit Niet- und Schweißrobotern konstruiert werden könnte.
Eine enorme Menge an Statistiken erfordert Fachwissen, Urteilsvermögen und Kreativität. "Canned" -Analysen, die mit einem Algorithmus ausgeführt werden, liefern häufig nicht die beste Antwort, und es gibt unzählige dokumentierte Beispiele, in denen die Verwendung automatisierter Methoden tatsächlich die falsche Antwort liefert - oder zumindest nicht die Antwort, die Sie zu erhalten glauben. Die Verwendung von schrittweisen p-Wert-basierten Variablenauswahlverfahren und die Analyse auf der Basis von rein numerisch definierten Quantilen sind mir am vertrautesten, aber ich bin mir sicher, dass Sie eine Fülle anderer finden können.
Auch wenn alles noch irgendwie automatisiert war, geht es darum, die Ergebnisse zu interpretieren. Die Arbeit des Statistikers (oder statistisch orientierten Wissenschaftlers) ist nicht erledigt, wenn Sie einen Regressionskoeffizienten oder einen p-Wert erhalten. Was bedeutet , dass die Suche nach Mittelwert . Was sind die Vorbehalte? Was bedeutet das im Kontext des Vorhergehenden?
Schließlich haben Sie die Entwicklung neuer Methoden. Statistiken wurden nicht einfach vor langer Zeit von Leuten entworfen, deren Namen wir kennen - Fisher, Cox usw. Es ist ein sich entwickelndes Feld, und Sie können eine neue Methode erst dann in einen Computer programmieren, wenn eine Person die Methode selbst entwickelt.
Eine andere Möglichkeit, diese Frage zu interpretieren, könnte sein: "Hat der rasche Anstieg der automatisierten statistischen Techniken in den letzten Jahren mit einer geringeren Nachfrage nach Stellen für engagierte Statistiker und Datenanalysten zu tun?"
Wir können diese Frage beantworten, indem wir uns die Daten ansehen
Daten mit freundlicher Genehmigung von indeed.com & revolutions blog
Ich bin mit der Prämisse der Frage nicht ganz einverstanden, dh ich glaube, es gibt keinen Weg, auf dem Computer jemals hoffen könnten, Statistiker zu ersetzen, sondern ein konkretes Beispiel dafür zu geben, warum ich das denke:
Die Arbeit der Statistiker mit Wissenschaftlern, insbesondere bei der Gestaltung und Interpretation von Experimenten, erfordert nicht nur einen menschlichen Verstand, sondern auch eine philosophische Neigung, die Computer niemals zeigen könnten.
Es sei denn, wir befinden uns in einer Art Skynet-Situation. In diesem Fall sind wahrscheinlich alle Wetten für die Zukunft der gesamten Menschheit ungültig, ganz zu schweigen von den Statistikern :-)
Die Frage deutet auf eine naive Sichtweise eines Statistikers hin - es geht darum, zu überprüfen, ob ap <0,05 ist, und einige Zahlen und Standarddiagramme zu melden. Wenn Sie das mit Statistiker meinen, dann haben Sie Recht damit, dass ein Großteil davon vollständig automatisiert werden könnte. Aber das bedeutet Statistiker nicht.
Definieren Sie jedoch Ihren Begriff Statistiker, und Sie erhalten möglicherweise bessere Antworten.
Wenn Sie ein Statistikpaket auf Ihren Computer laden, sind Sie kein Statistiker mehr, als wenn Sie ein Auto kaufen, mit dem Sie fahren können.
Auch wenn der Statistiker nur "Dosen" -Routinen anwendet, gibt es viele Fragen.
und so weiter.
Der Auftrag beginnt jedoch lange vor dem Einschalten des Computers und endet lange nach dem Ausschalten des Statistikpakets.
Vorher: Was möchte der Kunde tun? Das ist oft viel Arbeit! Welche Daten hat der Kunde? Oy vey! Die Variablen sind mit V1 bis V828171 beschriftet. Welche sind welche? Wie ist der Stand der Literatur? Was erwartet der Kunde? Wie technisch soll es sein?
Nach: Was Ergebnisse bedeuten ? (und nicht nur "dies bedeutet, dass die Regression signifikant ist") Wie sollten die Ergebnisse dem Kunden erklärt werden? Welche weiteren Fragen werfen die Ergebnisse auf?
Ich denke, es wird eine lange Zeit dauern, bis Computer dies tun können.
Studien, die die Wahrscheinlichkeit der Automatisierung verschiedener Berufe oder Aufgaben untersuchen, gehen nicht davon aus, dass die Statistiker bald durch Computer ersetzt werden. Siehe zum Beispiel die umstrittene Frey & Osborne (2013) -Studie, in der Berufe nach ihrer Wahrscheinlichkeit der Computerisierung eingestuft werden, wobei Statistiker mit einer Wahrscheinlichkeit von 22% auf dem niedrigen Rang 213 von 702 stehen (siehe Tabelle im Anhang). Wenn Sie weiter interessiert sind, lesen Sie auch den Slate-Artikel hier .
Arntz et al. (2016) ( hier ein The Economist-Artikel) befassen sich eher mit Aufgaben als mit Berufen in der Europäischen Union und kommen zu einem ähnlichen Ergebnis: "Komplexe Mathematik oder Statistik" hat einen statistisch signifikant negativen Einfluss auf die Automatisierbarkeit von Jobs (siehe Tabelle 3).
Aber Vorsicht ist geboten, Akademiker und / oder Ökonomen waren nicht immer sehr gut darin, die Zukunft vorherzusagen (der Nobelpreisträger Robert Lucas beispielsweise kam 2003, wenige Jahre vor der Finanzkrise, zu dem Schluss, dass das "zentrale Problem der Depressionsprävention" wurde für alle praktischen Zwecke gelöst und ist in der Tat seit vielen Jahrzehnten gelöst. " ). Beide Studien scheinen ein Arbeitspapier zu sein, das viel diskutiert, aber nicht in Standard-Fachzeitschriften veröffentlicht wurde.
In Bezug auf die akademische Debatte finden Sie hier einen Übersichtsartikel zum Stand der Automatisierungsforschung.