Как считается, сам термин Big Data ввёл редактор общенаучного издания Nature Клиффорд Линч. В своей статье он рассуждал о том, что в современном мире количество доступной для обработки информации растёт поистине взрывными темпами.
В общем смысле, Big Data (в переводе на русский – «Большие Данные») – это совокупность определенных способов и систем обработки гигантских массивов информации, как структурированных, так и нет. Появление этого понятия связывают с развитием высших компьютерных технологий до уровня, где те способы анализировать колоссальные объемы данных, о которых и писал Линч.
Что даёт обработка данных?
Обработка данных зачастую подразумевает систематизацию, то есть превращение неструктурированной информации в структурированную, более лёгкую для восприятия.
Неструктурированность – это как если бы человек, зашедший в «Икею», обнаруживал, что товары не распределены по категориям, а расставлены в случайном порядке. Два кресла находятся не в одном отделе, а в разных концах комнаты, рядом с одним продается холодильник, а с другим – шкаф. Примерно в таком состоянии изначально и находятся объемы данных, с которыми работает Big Data.
Структурировав хаотичную информацию, человек уже может выудить из большого потока что-то, нужное для себя, и в дальнейшем применить это себе на пользу.
Как понять, считаются ли данные «большими»?
Согласно людям, профессионально изучающим данную область, любой поток данных, скорость которого превышает сотню гигабайт в день, можно отнести к Big data. Впрочем, у больших данных есть и более общие характеристики. Так, принято выделять три «V»: volume – физический объём данных, velocity – скорость роста количества данных и темпов их обработки, variety – разнообразие данных, которые возможно обработать. К ним порой добавляют различные четвёртые «V», вроде value – экономическая ценность возможности работать с большим количеством информации.
Практическое применение технологий Big Data
Крупные компании, работающие с большим количеством финансовых средств, уже несколько лет используют Big Data. Банкам, например, это помогает оценивать кредитные способности своих клиентов, организовывать работу персонала, бороться с мошенниками, и многое другое.
Так, в «Сбербанке» еще в 2014 году была установлена интеллектуальная система АС САФИ, сравнивающая фотографии клиентов с веб-камер с фотографиями, хранящимися в банковском базе данных. Это помогло заметно снизить уровень мошенничества.
Заключение
Как можно увидеть, в сфере высших технологий Big Data является весьма перспективным направлением. Скорее всего, пока мы живем в информационном обществе, оно только продолжит развиваться и расширять свои возможности.