Сколько бы ни старался, не получается писать сразу после занятий, обработка информации требует много времени.
Занятии во вторник (3.03), началось с теста по прошлой теме, задания которого мы подробно разбирали после.
Лектором на этом занятии был Антон - big data engineer в Mail.ru Group. Он проводил занятие целиком и полностью посвященное HBase - базе данных для работы с Hadoop.
В основном разбирали архитектуру и внутреннее устройство этой базы данных.
Также, узнали, что в корпорации mail.ru активно юзают Hadoop и HBase.
Конечно, коснулись и команд для работы с Hbase.
А в самом конце разбирали CAP теорему, расшифровка ее аббревиатуры звучит так: Consistency (Целостность), Availability (Доступность) и Partition tolerance (Устойчивость к разделению). И главное правило из нее: любая база данных может иметь только два пункта.
Hbase относится к классу CP.
Успели сравнить базу данных Hbase с Cassandra, MongoDB , PostgresSQL и MySQL.
А вот что неплохо было бы почитать по теме:
Редмонд Эрик, Уилсон Джим - Семь баз данных за семь недель. Введение в современные базы данных и идеологию NoSQL.
Где описаны большинство из современных баз данных с открытым исходным кодом: Redis, Neo4J, CouchDB, MongoDB, HBase, PostgreSQL и Riak.