Greenplum — это база данных с массовой параллельной обработкой, построенная на PostgreSQL с возможностью масштабирования до рабочей нагрузки на уровне нескольких петабайт и обеспечивает доступ к кластеру мощных серверов, которые будут работать вместе в рамках единого интерфейса SQL, где мы можем просматривать все данные. Greenplum – это база данных с открытым исходным кодом, разработанная компанией Pivotal, которая позже была приобретена VMware. Архитектура ПО была специально разработана для управления крупномасштабными хранилищами данных, предоставляя вам возможность распределять ваши данные по множеству серверов. Чтобы лучше понять архитектуру Greenplum, давайте сначала рассмотрим, что такое база данных массивно-параллельной обработки (Massive Parallel Processing – MPP). При обработке больших объемов сложных данных велика вероятность того, что ваш сервер может начать "раздавливаться" из-за всех данных, которые он должен обрабатывать для получения результатов аналитики. Чтобы удовлетв