Hadoop можно рассматривать как систему-набор open-source программ, которые любой может использовать как "основу" для операций с большими данными (big data). Система Hadoop Можно сказать, что Hadoop состоит из "модулей", каждый из которых выполняет определенную задачу, необходимую для работы системы, предназначенной для анализа больших данных. Распределенная файловая система (HDFS) Основополагающим модулем Hadoop'а можно считать Распределенную файловую систему (HDFS - Hadoop Distributed File System)...
1. Greenplum Это база данных SQL с массовой параллельной обработкой данных с открытым исходным кодом, основанная на PostgreSQL. Это база данных, используется для аналитики. Он предназначен для управления крупномасштабными хранилищами данных и рабочими нагрузками бизнес-аналитики. Эта модель базы данных позволяет получить доступ к кластеру мощных серверов, взаимодействующих в рамках единого интерфейса SQL. Greenplum обеспечивает мощную и быструю аналитику данных, что позволяет масштабировать объемы данных до петабайт...