По данным аналитического агентства Gartner, шесть из десяти компаний сегодня ведут проекты в области искусственного интеллекта, а в следующем году бизнес планирует удвоить свои усилия по этому направлению. Эти цифры как нельзя лучше доказывают, что нейронные сети и системы машинного обучения входят в привычный инструментарий средней организации.
Сегодняшняя статья посвящена проектам, благодаря которым мир познакомился с возможностями этих технологий. Хотя академические дискуссии вокруг нейронных сетей шли еще в 40-х годах прошлого века, реальная их жизнь началась в 2000-х с алгоритмами глубинного обучения. О том, какое прикладное применение они получили в дальнейшем, и пойдет речь дальше.
Подробнее о технологиях, которые стоят за этими системами, читайте в наших материалах о Data Science и Машинному обучению.
Amazon — «Возможно, вам понравится…»
Как к этому ни относись, пока технология не приносит деньги, развития она не получит. Именно поэтому эру машинного обучения можно отсчитывать с 2012 года, когда крупнейший интернет-магазин заявил, что система онлайн-рекомендаций принесла ему почти 30% дополнительной прибыли.
Простая идея предлагать пользователям товары, которыми интересовались покупатели с похожей историей, на деле оказывается нетривиальной задачей. Эксперты Amazon смогли правильно применить аналитику, чтобы понять своих посетителей. После внедрения новой системы квартальная выручка компании выросла почти на три миллиарда долларов.
Сегодня корпорация использует машинное обучение еще и для борьбы с мошенничеством. Автоматические системы отслеживают платежные транзакции и помечают подозрительные события для дополнительной проверки. Как и другие ML-решения Amazon, эти возможности предлагаются в аренду клиентам ее облачного сервиса — так компания получает дополнительную монетизацию своих разработок.
IBM — Мой дорогой Watson
Трудно представить высокопроизводительные аналитические системы без высокопроизводительного вычислительного оборудования. В этой области многими достижениями отметились разработчики IBM, которые уже много лет работают над решением — без преувеличения — самых актуальных задач человечества.
Например, применяют глубинное обучение для метеорологических прогнозов, чтобы сокращать ущерб от стихийных бедствий. Речь не только о предсказании ураганов, но и умном контроле деревьев, грозящих порвать линии электропередач.
Но главный персонаж на этой сцене — это суперкомпьютер Watson, который начал работу в 2010 году и получил огромное применение в медицине. Вычислительные мощности этого агрегата используются в комплексной диагностике и поиске новых лекарств. Буквально в последние дни специалисты IBM объявили, что Watson поможет медицинским исследователям лечить рак. Для этого аналитические модели будут работать с ДНК пациентов, определяя лучший способ лечения.
Intel — Машины как люди
Продолжая тему продвинутого «железа», нельзя не вспомнить о другом мировом технологическом лидере. Пока программисты воспроизводят человеческое мышление в нейронных сетях, специалисты Intel создают модели человеческого мозга на микросхемах. Работы предстоит еще много — в наших черепах работают около 86 миллиардов клеток, а инженеры Intel сконструировали процессор Loihi «всего» с 8 миллионами цифровых нейронов. Но и это невероятный результат для индустрии, причем уже к следующему году специалисты надеются повысить результат до 100 миллионов «клеток».
Аналогия с мозгом в данном случае абсолютно справедлива, поскольку инженеры воспроизводят механику мозга. Как и у человеческих нейронов, у компьютерных есть свои аксоны, дендриты и синапсы, с помощью которых передаются данные. В результате такие модели можно использовать в биомеханике, создавая способную передавать ощущения искусственную кожу и высокотехнологичные протезы.
Возвращаясь к теме нашей статьи, отметим, что разработки Intel, объединяющие в себе объединяют в себе достижения компьютерной инженерии, машинного обучения и еще нескольких различных дисциплин, перевернут и представления о нейронных сетях. Нас ждут по-настоящему живые чат-боты, машины, действительно способные различать объекты на дороге, камеры безопасности, различающие «своего» и «чужого». Наконец, программное обеспечение, которое сегодня упирается в потолок производительности чипа, получит новый скачок в мощности. Хочется верить, что это даст нечто большее, чем детально прорисованную щетину «Мстителей-25».
Baidu — Узнаю тебя по голосу
Когда речь заходит о цифровых помощниках, чат-ботах и прочих несуществующих сущностях, многие задумываются, как заставить программу понять суть вопроса. Но не стоит забывать, что боту нужно еще и озвучить ответ. Это и обуславливает важность технологий синтеза человеческой речи, которые также используют средства ML.
Особыми достижениями в этой области отметился китайский гигант Baidu. Его специалисты научились синтезировать голос буквально по одной произнесенной в микрофон фразе — программа точно воспроизводит произношение.
На демонстрационных видео можно послушать, как робот разговаривает мужскими и женскими голосами, копирует британский или американский акцент. Специалисты называют это клонированием голоса — экспертам и вправду удается создавать копии невероятной точности. Оценить эволюцию технологий можно по тому факту, что в 2017 году программе требовалось 30 минут исходного материала, а сегодня роботу хватает всего 3,7 секунды.
Этими технологиями пользуются разработчики различных программных интерфейсов для слабовидящих людей. В таких программах всегда звучит голос, который будет приятен большинству пользователей, и создать его по заданным параметрам может быть проще, чем найти реального диктора. Нетрудно представить, что в эпоху биометрической аутентификации и голосовых отпечатков и мошенникам тоже может пригодиться синтезированная речь. Какие находки защитят наш голос от подделки, покажет ближайшее будущее.
Deep Fake — Царь ненастоящий
В 2018 году по Интернету разошелся ролик, в котором бывший президент США Обама называет нынешнего президента США Трампа «полным [Роскомнадзор]». Создатели видео не пытались никого обманывать и сразу объяснили — устами все того же Обамы — что это демонстрация ML-технологии DeepFake.
Чтобы создать такую фальшивку, используются два набора материалов — на одних видео должен быть человек, которого нужно изобразить, на других человек, который будет на самом деле произносить нужные слова. Алгоритм изучает мимику целевого объекта, после чего может наложить его лицо на другую модель. Добавляем синтез речи из предыдущего пункта, шлифуем косметику — готово.
Ложный Обама предупреждал зрителей о «врагах», которые могут заставить любого человека сказать и сделать что угодно — хоть и на поддельном видео. Пожалуй, в этом случае технология действительно имеет исключительно злокозненный характер. В Индии жертвы такого обмана столкнулись с физическим насилием после того, как их лица появились в порнороликах. Защита от такой угрозы также входит в число приоритетных задач как для технологических экспертов, так и органов правопорядка.
Facebook — Роботизация человеческих отношений
Продолжая предыдущую мысль, стоит сказать, что главную роль в решении этой проблемы вполне может сыграть крупнейшая в мире социальная сеть. Собственно говоря, Facebook уже использует собственные алгоритмы машинного обучения, чтобы бороться с проявлениями ненависти и блокировать агрессивных пользователей. По словам разработчиков, их система не просто переводит слова по словарю, а понимает скрытый смысл высказываний. Более того, для нее не имеет значения язык, на котором написана та или иная фраза — определение смысла происходит по контекстной модели.
Подобно Amazon, Facebook анализирует пользовательское поведение, чтобы создавать «умную ленту новостей» — записи показываются по специальному алгоритму, который должен обеспечить интересным публикациям большую аудиторию. Из-за закрытости этого механизма пользователи нередко негодуют, почему одни посты постоянно попадают на экран, а другие остаются непрочитанными. Как бы то ни было, очевидно, что без этих «костылей» ленты утонут в спаме и простынях малограмотного текста.
Можно также вспомнить разработки Facebook по распознаванию изображений или возможности Facebook Messenger для понимания человеческой речи и создания чат-ботов. Однако, судя по тому, как часто Марк Чукерберг вспоминал об искусственном интеллекте в своей речи перед Конгрессом США, этой статьи все равно не хватит, чтобы перечислить все разработки.
Google — Фабрика машинного обучения
То же самое справедливо и для Google, чьи специалисты написали уже 1600 работ по разным аспектам машинного обучения. Очевидно, первоначальной целью было улучшить работу поискового движка — для этого нужно, чтобы робот понимал суть человеческих вопросов. В эту же копилку попадают исследования в области перевода и предложения вариантов запроса до того, как пользователь закончит печатать.
Впрочем, деньги Google приносит не поиск, а реклама. Поэтому эксперты корпорации внедрили умные алгоритмы в механизм ставок, который определяет место каждого объявления в очереди на показ.
Дочерние продукты Google также вовсю развивают ML-технологии. На YouTube с их помощью блокируется нежелательный контент, а Gmail предлагает пользователям автоматические ответы на поступающие письма. Наконец, ни в коем случае не забудем Google Assistant — многофункциональный помощник, живущий в Android-смартфонах. Не будем начинать холивар, но многие пользователи ставят его выше конкурентов, полагая, что синергия с экосистемой Google обеспечивает Ассистенту заметное преимущество.
Tesla — Технологии на грани магии
Как бы кто ни относился к Илону Маску, невозможно отрицать достижения его компании в области беспилотных автомобилей. На YouTube достаточно видеороликов, его автопилот Tesla точным маневром уводит машину от неаккуратных участников движения или вышедших на дорогу животных. Система слежения может даже распознать аварийную ситуацию еще ДО того, как машины впереди столкнутся.
Как писал фантаст Артур Кларк, любая достаточно развитая технология неотличима от волшебства. Впечатляющие возможности Tesla, чьи автомобили за прошедшие годы не спровоцировали ни одного ДТП, целиком построены на машинном обучении. И с каждым пройденным километром эти возможности только развиваются.
Разумеется, другие компании активно применяют те же методы для своих разработок. Причем наверняка в скором будущем мы увидим на этом поле не только привычных автопроизводителей, но и другие новые лица. Когда в следующий раз будете искать на капче дорожные знаки и автобусы, задумайтесь, почему Google нужна помощь с определением таких объектов на фото.
Uber — Кратчайший путь куда угодно
Еще один дерзкий новичок автомобильной отрасли не просто экспериментирует с машинным обучением, а запустил целую ML-платформу Michelangelo. Ее используют самые разные департаменты компании. Подразделение доставки еды UberEATS строит модели для точного предсказания времени курьера в пути на базе десятка параметров. Прежде чем выдать результат, алгоритм даже проверяет, как работники ресторана справляются с нагрузкой в последний час и в последнюю неделю.
Подразделение клиентской поддержки применяет ML-технологии, чтобы обрабатывать обращения недовольных пользователей. По подсчетам Uber, внедрение аналитических моделей позволило им на 15% ускорить решение проблем. Это не только снижает нагрузку на сотрудников, но и экономит сотни тысяч долларов в год.
Яндекс — За державу не обидно
Единственная российская компания в нашей подборке не зря считается главным проводником инноваций в стране. Именно Яндекс создал открытую систему машинного обучения CatBoost, которая используется на Большом адронном коллайдере. Исходный код библиотеки, документация и прочие необходимые инструменты доступны всем желающим на Github. По словам разработчиков, решение можно использовать для обучения моделей на любых данных в любых областях — от металлургии и нефтеобработки до финансовой аналитики и стриминга кино.
Отдельная служба машинного обучения есть в «Яндекс.Такси». Эти эксперты делают так, чтобы приложение понимало, когда пользователь хочет поехать на работу, а когда — в ресторан отдохнуть. Таким образом они могут формировать оптимальные тарифы, которые устроят и водителя, и пассажира. Эти же технологии помогают развивать внутренние бизнес-процессы «Яндекс.Такси»: поддержку пользователей, контроль качества автомобилей, работу с водителями.