Hive ist eine Datenbank, die auf Hadoop aufbaut und eine einfache Zusammenfassung von Daten, Ad-hoc-Abfragen und die Analyse großer Datenmengen ermöglicht, die in einem Hadoop-kompatiblen verteilten Dateisystem gespeichert sind. Hive bietet einen Mechanismus zum Projizieren der Struktur auf diese Daten und zum Abfragen der Daten mithilfe einer SQL-ähnlichen Sprache namens HiveQL.