Apache Hive — система управления базами данных на основе платформы Hadoop с SQL-подобным языком запросов, позволяет выполнять запросы, агрегировать и анализировать данные. Компонент экосистемы Hadoop. Создан корпорацией Facebook, в 2011 году передан под открытой лицензией в фонд Apache. Apache Hive — это система хранилища данных для Apache Hadoop. Hive включает сводку данных, запросы и анализ данных. Запросы Hive записываются в HiveQL, который является языком запросов, похожим на SQL. Hive позволяет проектировать структуру в значительной степени неструктурированных данных. После определения структуры можно использовать HiveQL для запроса данных без знаний Java или MapReduce. HDInsight предоставляет несколько типов кластеров, которые настраиваются для определенных рабочих нагрузок. Для запросов Hive чаще всего используются следующие типы кластеров: