Hadoop ist eine Open-Source-Lösung für die Bereitstellung eines verteilten / replizierten Dateisystems, eines Systems zur Kartenreduzierung in Produktionsqualität, und verfügt über eine Reihe ergänzender Ergänzungen wie Hive, Pig und HBase, um mehr aus einem Hadoop-basierten Cluster herauszuholen.