Найти в Дзене
Дом Интереса

Нейронные сети и глубокое обучение

Оглавление

Как подмножество искусственного интеллекта, глубокое обучение лежит в основе различных инноваций: самоуправляемые автомобили, обработка естественного языка, распознавание изображений и так далее. Компании, предоставляющие решения DL, находятся на переднем крае фондовых рынков и привлекают впечатляющие инвестиции. По данным Statista, общее финансирование стартап-компаний в области искусственного интеллекта по всему миру составляет более 26 миллиардов долларов. Этот высокий интерес можно объяснить удивительными преимуществами глубокого обучения и его архитектур — искусственных нейронных сетей.

Что такое глубокое обучение?

Глубокое обучение-это одно из подмножеств машинного обучения, которое использует алгоритмы глубокого обучения для неявного вывода важных выводов на основе входных данных.

Обычно глубокое обучение проводится без присмотра или под полуконтролем. Глубокое обучение основано на обучении представлению. Вместо использования алгоритмов, специфичных для конкретных задач, он учится на репрезентативных примерах.

Основными архитектурами глубокого обучения являются:

  • Сверточные нейронные сети
  • Рекуррентные нейронные сети
  • Порождающие состязательные сети
  • Рекурсивные нейронные сети

Разница между машинным обучением и глубоким обучением

Машинное обучение пытается извлечь новые знания из большого набора предварительно обработанных данных, загруженных в систему. Программисты должны сформулировать правила для машины, и она учится на их основе.

Однако глубокое обучение-это немного другое:

-2

Преимущества глубокого обучения

  • В 2015 году группа инженеров Google проводила исследование о том, как NN выполняют задачи классификации. Случайно они также заметили, что нейронные сети могут галлюцинировать и создавать довольно интересное искусство.
  • Способность выявлять закономерности и аномалии в больших объемах необработанных данных позволяет в процессе глубокого обучения эффективно предоставлять точные и надежные результаты анализа профессионалам. Например, у Amazon более 560 миллионов товаров на веб-сайте и более 300 миллионов пользователей. Ни один бухгалтер-человек или даже целая армия бухгалтеров не смогли бы отслеживать такое количество транзакций без инструмента искусственного интеллекта.
  • Глубокое обучение опирается не столько на человеческий опыт, сколько на традиционное машинное обучение. DL позволяет нам делать открытия в данных, даже когда разработчики не уверены в том, что они пытаются найти. Например, вы хотите, чтобы ваши алгоритмы могли предсказывать удержание клиентов, но вы не уверены, какие характеристики клиента позволят системе сделать это предсказание.

Проблемы глубокого обучения

  • Для сбора больших объемов качественных данных требуется много ресурсов. В течение многих лет самой большой и хорошо подготовленной коллекцией образцов была ImageNet с 14 миллионами различных изображений и более чем 20 000 категориями. Он был основан в 2012 году, и только в прошлом году Tencent выпустила базу данных, которая стала больше и более универсальной.
  • Еще одна трудность с технологией глубокого обучения заключается в том, что она не может предоставить оснований для своих выводов. Поэтому трудно оценить производительность модели, если вы не знаете, каким должен быть выход. В отличие от традиционного машинного обучения, вы не сможете протестировать алгоритм и выяснить, почему ваша система решила, что, например, на картинке изображена кошка, а не собака.
  • Создание алгоритмов глубокого обучения обходится очень дорого. Это невозможно без квалифицированных сотрудников, обученных работе со сложной математикой. Более того, глубокое обучение-это ресурсоемкая технология. Для обучения моделей требуются мощные графические процессоры и много памяти. Для хранения входных данных, весовых параметров и функций активации требуется много памяти по мере распространения входных данных по сети. Иногда алгоритмы глубокого обучения становятся настолько энергозатратными, что исследователи предпочитают использовать другие алгоритмы, даже жертвуя точностью прогнозов.

Что такое искусственные нейронные сети?

“Искусственные нейронные сети” и “глубокое обучение” часто используются взаимозаменяемо, что на самом деле не совсем правильно. Не все нейронные сети являются “глубокими”, что означает “со многими скрытыми слоями”, и не все архитектуры глубокого обучения являются нейронными сетями. Например, существуют также сети глубоких убеждений.

-3