В современном цифровом мире объёмы данных растут в геометрической прогрессии. Компании, госслужбы и научные организации накапливают терабайты, а порой и петабайты информации — от пользовательских кликов до показателей работы промышленных датчиков. Этот поток и называют «большими данными» (Big Data). Ниже разберёмся, в чём суть Big Data, почему об этом столько говорят и в каких сферах это уже работает. Big Data — это большие объёмы неоднородной и непрерывно генерируемой информации, которые слишком огромны и сложны для обработки традиционными инструментами (обычными базами данных или стандартными алгоритмами). 1. Volume (Объём) — количество данных может достигать терабайтов и петабайт.
2. Velocity (Скорость) — данные поступают в режиме реального времени или почти непрерывно.
3. Variety (Разнообразие) — структура может быть очень разной: текст, картинки, видео, логи, показания датчиков, соцсети и т.д. Иногда к этому списку добавляют ещё Veracity (достоверность) и Value (ценность), подчерк