Найти тему
Dronreview

Big Data: что это и для чего используется

Оглавление

Как считается, сам термин Big Data ввёл редактор общенаучного издания Nature Клиффорд Линч. В своей статье он рассуждал о том, что в современном мире количество доступной для обработки информации растёт поистине взрывными темпами.

В общем смысле, Big Data (в переводе на русский – «Большие Данные») – это совокупность определенных способов и систем обработки гигантских массивов информации, как структурированных, так и нет. Появление этого понятия связывают с развитием высших компьютерных технологий до уровня, где те способы анализировать колоссальные объемы данных, о которых и писал Линч.

Что даёт обработка данных?

Обработка данных зачастую подразумевает систематизацию, то есть превращение неструктурированной информации в структурированную, более лёгкую для восприятия.

Неструктурированность – это как если бы человек, зашедший в «Икею», обнаруживал, что товары не распределены по категориям, а расставлены в случайном порядке. Два кресла находятся не в одном отделе, а в разных концах комнаты, рядом с одним продается холодильник, а с другим – шкаф. Примерно в таком состоянии изначально и находятся объемы данных, с которыми работает Big Data.

Структурировав хаотичную информацию, человек уже может выудить из большого потока что-то, нужное для себя, и в дальнейшем применить это себе на пользу.

Как понять, считаются ли данные «большими»?

Согласно людям, профессионально изучающим данную область, любой поток данных, скорость которого превышает сотню гигабайт в день, можно отнести к Big data. Впрочем, у больших данных есть и более общие характеристики. Так, принято выделять три «V»: volume – физический объём данных, velocity – скорость роста количества данных и темпов их обработки, variety – разнообразие данных, которые возможно обработать. К ним порой добавляют различные четвёртые «V», вроде value – экономическая ценность возможности работать с большим количеством информации.

Практическое применение технологий Big Data

Крупные компании, работающие с большим количеством финансовых средств, уже несколько лет используют Big Data. Банкам, например, это помогает оценивать кредитные способности своих клиентов, организовывать работу персонала, бороться с мошенниками, и многое другое.

Так, в «Сбербанке» еще в 2014 году была установлена интеллектуальная система АС САФИ, сравнивающая фотографии клиентов с веб-камер с фотографиями, хранящимися в банковском базе данных. Это помогло заметно снизить уровень мошенничества.

-2

Заключение

Как можно увидеть, в сфере высших технологий Big Data является весьма перспективным направлением. Скорее всего, пока мы живем в информационном обществе, оно только продолжит развиваться и расширять свои возможности.