Специалистам, работающим с огромными массивами данных, необходимо осваивать большие технологии. Об одной из них и пойдет речь в этой статье.
Hadoop - это проект фонда Apache Software Foundation, предназначенный...
Hadoop можно рассматривать как систему-набор open-source программ, которые любой может использовать как "основу" для операций с большими данными (big data). Система Hadoop Можно сказать, что Hadoop состоит из "модулей", каждый из которых выполняет определенную задачу, необходимую для работы системы, предназначенной для анализа больших данных. Распределенная файловая система (HDFS) Основополагающим модулем Hadoop'а можно считать Распределенную файловую систему (HDFS - Hadoop Distributed File System)...