4,6K подписчиков
Организация Apache Software Foundation опубликовала релиз Apache Hadoop 3.2, свободной платформы для организации распределённой обработки больших объёмов данных с использованием парадигмы map/reduce, при которой задача делится на множество более мелких обособленных фрагментов, каждый из которых может быть запущен на отдельном узле кластера. Хранилище на базе Hadoop может охватывать тысячи узлов и содержать эксабайты данных. В состав Hadoop входит реализация распределенной файловой системы...
5 лет назад
19 подписчиков
Сколько бы ни старался, не получается писать сразу после занятий, обработка информации требует много времени. Занятии во вторник (3.03), началось с теста по прошлой теме, задания которого мы подробно разбирали после. Лектором на этом занятии был Антон - big data engineer в Mail.ru Group. Он проводил занятие целиком и полностью посвященное HBase - базе данных для работы с Hadoop. В основном разбирали архитектуру и внутреннее устройство этой базы данных. Также, узнали, что в корпорации mail.ru активно юзают Hadoop и HBase...
6 лет назад