Биг дата и датасайнтисты – актуальные термины в мире информации. Но что это такое и нужно ли об этом знать простым пользователям Интернета? Data Scientist – это тот, кто исследует Big data. А Big data – это большое количество данных, данных о вас, к примеру. Нужно ли знать о тех, кто собирает о вас информацию, решать вам.
Вы зашли в приложение, полистали новостную ленту, зашли в интернет-магазин, сделали заказ. Через некоторое время в рекламе вы чаще видите товары, которые смотрели. А еще в плэй-листе вам попадается в основном хорошая музыка. Как удачно! Но это не удача, а работа датасайнтистов.
Они вас вычислили и следят за вами? Нет, эти специалисты обучают искусственный интеллект на основе обработки большого количества данных и делают наш мир лучше и удобнее.
Собирается непостижимо много разнообразной информации, и скорость ее обработки постоянно растет. Как правило, биг дата измеряется в терабайтах, петабайтах, эксабайтах или в квинтиллионе (это 1 000 000 000 000 000 000) байтов информации!
Источники биг даты разные: социальные сети, бизнес-записи, датчики в интернет-магазинах, а также отдельные программные инструменты.
Как большие данные могут помочь нам улучшить мир, в котором мы живем? Давайте рассмотрим немного примеров.
Городское планирование
Нет, это не научная фантастика. В больших городах датчики сообщают нам, когда мусорный бак заполнен. Кругом установлены датчики загрязнения воздуха и изменения направления парковки.
Городское планирование становится все более сложным, поскольку за ресурсы конкурируют многочисленные системы – коммунальные услуги, энергия, жилье, транспорт и инфраструктура, и это лишь некоторые из них. Существует огромное количество данных о городах и их жителях, а также о том, как они используют свое пространство. Это означает, что городские планировщики должны уметь использовать большие данные.
Многие города используют большие данные для преобразования своих муниципалитетов в умные города. Например, в Лондоне большие данные используются для управления отходами, снижения затрат и повышения качества жизни и работы. Так оперативно решаются проблемы с парковкой, загрязнением и потреблением энергии.
Защита окружающей среды
Большие данные могут помочь спасти планету.
Вырубка лесов – острая проблема – уничтожаются жизненно важные деревья и места обитания растений и животных.
Большие данные помогают снизить уничтожение лесов. Спутниковые изображения, высокотехнологичная обработка данных и краудсорсинг (работа большой команды людей) могут предоставить данные о лесах мира практически в реальном времени. Во время выявляются очаги пожаров и случаи браконъерства.
Здравоохранение
Большие данные позволяют ученым разгадывать целые последовательности ДНК за считанные минуты. Это означает повышенную способность предсказывать паттерны болезней и мутаций.
Данные со смарт-часов помогают наблюдать за недоношенными и больными младенцами. Большие данные позволяют анализировать все изменения сердцебиения и ритм дыхания каждого ребенка. Теперь ученые могут разрабатывать алгоритмы, которые прогнозируют наличие инфекции за несколько часов до появления физических симптомов.
Большие данные помогают контролировать бедные районы и выявлять людей, которым нужна помощь, через их поведение в Интернете или использование сотового телефона.
Конечно, Big data вторгается в конфиденциальную жизнь человека и может вызвать конфликтные ситуации. Но возможно ли развитие чувствительных социальных технологий при табу на изучение нашего поведения, как вы считаете?