TL; DR
Wenn Sie unbegrenzte Zeit haben und eine 64-Bit-Version von Excel verwenden, können Sie mit Excel so weit kommen wie mit jedem anderen Datenanalysetool.
Zeit
Ich erwähne die Zeit als meinen ersten Faktor, da in Excel nur grundlegende Funktionen integriert sind, wie z. B. Summieren, Generieren von Zufallszahlen, Nachschlagen usw. Diese entsprechen einer Art Standardbibliothek , über die Python und R ebenfalls verfügen. Mit diesen Grundfunktionen können Sie mit genügend Zeit so ziemlich jedes Analysetool aufbauen. Erwarten Sie keine gute Laufzeitleistung. In Python und R gibt es jedoch viele, viele Pakete, die bereits erstellt wurden, die eine gute Leistung erbringen und von vielen Personen getestet wurden und denen daher vertraut wird.
Erinnerung
Mein zweiter Punkt zu 64-Bit-Excel ist, dass dadurch viel mehr Speicher von einer einzelnen Excel-Instanz verwendet werden kann. Dadurch können viel mehr Zellen gefüllt werden. Die Verwendung von 32-Bit-Excel beschränkt Sie auf Projekte mit etwa 2 GB. Das ist eine ganze Menge Daten, aber es ist eine harte Grenze.
Dann Schritte in 64-Bit-Excel, was im Grunde keine Speicherbeschränkungen mehr bedeutet - nur diejenigen, die von Ihrer Hardware stammen, und das bedeutet, dass Python und R ebenfalls in ihren Spuren gestoppt werden.
Um einige Zahlen bereitzustellen, können wir einfach die Anzahl der Bits berechnen, die in jeder Version gespeichert werden können. Hier in Pythons interaktiver Eingabeaufforderung:
In [1]: (2**32) / 10**9 # 10^9 means the result is 4.3 Gb
Out[1]: 4.294967296
In [9]: (2**64) / 10**18 # 10^15 means the result is 18.4 Eb
Out[9]: 18.446744073709553
Eb
bedeutet exa-Bytes . Dies bedeutet 18,4 Millionen Millionen Gigabyte.
Ich stelle fest, dass die Berechnung 4 GB für 32-Bit anzeigt, während ich oben 2 GB sagte. Ich habe gelesen, dass die 32-Bit-Version eine Art hartes Limit hat. Ich weiß nicht oder kümmere mich nicht darum, warum das so ist ... Ich benutze Python und R ;-)
Auf jeden Fall hoffe ich, dass dies ausreicht, um Sie davon zu überzeugen, dass das Gedächtnis kein Thema ist, wenn Sie eine mutige Person sind, die bereit ist, Ihre ganze Zeit damit zu verbringen, Werkzeuge von Grund auf aufzubauen!
Zusammenfassung
Wenn Sie eine komplizierte Geschäftslogik haben, bei der die eigentliche Analyse mathematisch einfach ist, bleiben Sie bei Excel. Geschäftsleute werden Sie dafür lieben.
Wenn Sie mehr als eine lineare Regression durchführen möchten, verwenden Sie Python oder R.
Vorsichtsmaßnahmen
Soweit ich weiß, können Sie mit Excel keine Remote- oder verteilten Aufgaben ausführen, während dies mit Python und (meiner Meinung nach etwas weniger) R relativ einfach ist. An diesem Punkt würde ich Excel aufgeben. Sie müssten wahrscheinlich Ihre eigenen Tools in C # oder C ++ mithilfe des .NET-Frameworks implementieren.