Apache Spark ist ein Open-Source-Cluster-Computing-System, mit dem Datenanalysen schnell durchgeführt werden sollen - sowohl schnell ausgeführt als auch schnell geschrieben werden können. Es wurde ursprünglich im AMPLab an der UC Berkeley entwickelt.