Найти тему
BigDataBoss

Hbase

Сколько бы ни старался, не получается писать сразу после занятий, обработка информации требует много времени.

Занятии во вторник (3.03), началось с теста по прошлой теме, задания которого мы подробно разбирали после.

тотальный разбор
тотальный разбор

Лектором на этом занятии был Антон - big data engineer в Mail.ru Group. Он проводил занятие целиком и полностью посвященное HBase - базе данных для работы с Hadoop.
В основном разбирали архитектуру и внутреннее устройство этой базы данных.
Также, узнали, что в корпорации mail.ru активно юзают Hadoop и HBase.

Конечно, коснулись и команд для работы с Hbase.

архитектура
архитектура

А в самом конце разбирали CAP теорему, расшифровка ее аббревиатуры звучит так: Consistency (Целостность), Availability (Доступность) и Partition tolerance (Устойчивость к разделению). И главное правило из нее: любая база данных может иметь только два пункта.
Hbase относится к классу CP.

Успели сравнить базу данных Hbase с Cassandra, MongoDB , PostgresSQL и MySQL.

А вот что неплохо было бы почитать по теме:

Редмонд Эрик, Уилсон Джим - Семь баз данных за семь недель. Введение в современные базы данных и идеологию NoSQL.
Где описаны большинство из современных баз данных с открытым исходным кодом: Redis, Neo4J, CouchDB, MongoDB, HBase, PostgreSQL и Riak.