002. YT — эволюция MapReduce-системы Яндекса — Максим Бабенко
Системы обработки больших данных (Big Data)
1. Объём накопленных человечеством цифровых данных на 2023 год измеряется: Зеттабайтами 2. Определите правильную последовательность модели распределенных вычислений MapReduce: 1) Reduce 2) предварительные 3) данные 4) выбирает 5) их 6) агрегирует 7) Map 3. Установите соответствие целей инфраструктуры Hadoop и их определений: Надежность - достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя Отказоустойчивость - обнаружение сбоев и их автоматическое и применение автоматического восстановления Масштабируемость - данные и их обработка распределяются...
Эволюция архитектуры данных. Data Warehouse, Data Lake, Data Lakehouse, Data Fabric, Data Mesh – что это такое, и в чем разница
Данные сегодня стали важным ресурсом для бизнеса, но для того, чтобы на их основе принимать правильные управленческие решения, нужно их правильно хранить и обрабатывать.
Хранилища данных предоставляют инфраструктуру и инструменты сбора, хранения, обработки больших объемов информации для дальнейшей бизнес-аналитики.
Эпоха современных хранилищ данных началась с появления реляционных баз данных (далее БД). С появлением бизнес-аналитики следствием развития БД стала концепция Data Warehouse (корпоративное хранилище данных, DWH)...