Als ich Absolventenstatistik unterrichtete, sagte ich meinen Schülern: "Es ist mir egal, welches Paket Sie verwenden, und Sie können alles für Ihre Hausaufgaben verwenden, da ich davon ausgehe, dass Sie fundierte Erklärungen liefern und Punkte entfernen, wenn ich sehen tr23y5m
Variablennamen in Ihren Einsendungen. Ich kann Ihr Lernen in Stata sehr gut und in R ziemlich gut unterstützen. Mit SAS sind Sie auf sich allein gestellt, da Sie behaupten, einen Kurs darin belegt zu haben. Mit SPSS oder Minitab segne ich Sie. "Ich stelle mir vor, dass die vernünftigen Arbeitgeber dasselbe denken würden. Entscheidend ist Ihre Produktivität in Bezug auf die Projektergebnisse. Wenn Sie das Ziel in R mit 40 Stunden Arbeit erreichen können, gut, wenn Sie können es in C ++ in 40 Stunden erreichen, gut, wenn Sie wissen, wie man dies in R in 40 Stunden macht, aber Ihr Vorgesetzter möchte, dass Sie dies in SAS tun, und Sie müssen 60 Stunden damit verbringen, nur um einige Grundlagen zu erlernen und wo die Semikolons hingehen, das kann nur im Zusammenhang mit dem großen Bild des restlichen Codes in SAS klug sein ... und dann war der Manager nicht sehr klug darin, einen R-Programmierer engagiert zu haben.
Aus dieser Perspektive der Gesamtkosten ist "freies" R ein enorm überzähliger Mythos. Jedes ernsthafte Projekt erfordert benutzerdefinierten Code, allein für die Dateneingabe und die Formatierung der Ausgabe, und das ist ein Zeitaufwand ungleich Null. Wenn diese Dateneingabe und -formatierung 10 Stunden SAS-Code und 20 Stunden R-Code erfordert, ist R eine teurere Software am Rande , wie ein Ökonom sagen würde, dh im Hinblick auf die zusätzlichen Kosten, um ein bestimmtes Stück Funktionalität zu produzieren . Wenn für ein großes Projekt 200 Stunden R-Programmiererzeit und 100 Stunden Stata-Programmiererzeit erforderlich sind, um identische Funktionen bereitzustellen, ist Stata insgesamt günstiger, auch für die ~ $ 1K Lizenz, die Sie kaufen müssen. Es wäre interessant, solche direkten Vergleiche zu sehen; Ich war daran beteiligt, ein riesiges Durcheinander von 2 MB SPSS-Code umzuschreiben, das sich über einen Zeitraum von etwa 10 Personenjahren in etwa 150 KB Stata-Code angesammelt haben soll. das war ungefähr 1 Person-Jahr-Projekt. Ich weiß nicht, ob dieses Verhältnis von 10: 1 typisch für SPSS: Stata-Vergleiche ist, aber ich würde mich nicht wundern, wenn es so wäre. Für mich ist die Arbeit mit R aufgrund der Suchkosten immer ein großer Aufwand: Ich muss feststellen, welches der fünf Pakete mit ähnlichen Namen das tut, was ich tun muss, und abschätzen, ob es zuverlässig genug ist, damit ich es verwenden kann meine Arbeit. Es bedeutet oft, dass es für mich billiger ist, meinen eigenen Stata-Code in kürzerer Zeit zu schreiben, als ich dafür aufwenden würde, um herauszufinden, wie R in einer bestimmten Aufgabe funktioniert. Es versteht sich, dass dies meine persönliche Eigenart ist; Die meisten Leute auf dieser Site nutzen R besser als ich.
Komisch, dass Ihr Profi Stata oder GAUSS R vorziehen würde, weil "R nicht von Wirtschaftswissenschaftlern geschrieben wurde". Weder Stata noch GAUSS; Sie werden von Informatikern mit den Werkzeugen von Informatikern geschrieben. Wenn Ihr Profi von CodeAcademy.com Anregungen zum Programmieren bekommt, ist das besser als gar nichts. Die professionelle Softwareentwicklung unterscheidet sich jedoch ebenso vom Eingeben in das Textfeld von CodeAcademy.com wie das Fahren eines Lastwagens vom Radfahren. (Stata wurde von einem zu einem Arbeitsökonomen konvertierten Informatiker gegründet, aber er macht diese Sache der Arbeitsökonometrie seit etwa 25 Jahren nicht mehr.)
Update : Wie AndyW unten kommentierte, können Sie schrecklichen Code in jeder Sprache schreiben. Dann stellt sich die Frage nach den Kosten, welche Sprache leichter zu debuggen ist. Für mich ist das eine Kombination aus der Genauigkeit und Aussagekraft der Ausgabe und der Einfachheit und Transparenz der Syntax selbst, auf die ich natürlich keine gute Antwort habe. Zum Beispiel erzwingt Python das Einrücken von Code, was eine gute Idee ist. Stata- und R-Code können über die Klammern geklappt werden, was bei SAS nicht funktioniert. Die Verwendung von Unterprogrammen ist ein zweischneidiges Schwert: Die Verwendung von *apply()
Ad-hoc-Funktionen function
in R ist offensichtlich sehr effizient, aber schwieriger zu debuggen. Aus einem ähnlichen Grund können Stata local
s fast alles maskieren, und wenn standardmäßig eine leere Zeichenfolge verwendet wird, kann dies zwar nützlich sein, aber auch zu schwer zu fassenden Fehlern führen.