Представляем перевод статьи What’s Next For AI? Enter: Deep Reasoning, подготовленный экспертами Агентства Искусственного Интеллекта.
Комментарий директора по науке и технологиям АИИ Душкина Романа:
Ну что ж... Не прошло и 70 лет, как младопрограммисты открыли для себя «старый добрый искусственный интеллект» (good old-fashioned artificial intelligence, GOFAI) — нисходящую парадигму, символьный подход. Вот к чему приводит отсутствие фундаментальных знаний в математике. Конечно, наблатыкаться на питончике и втыкать в Керас или Тензорфлоу без понимания сути происходящих внутри процессов — это очень несложно, мозги не напрягает. Главное, написать: import Tensorflow as TF, вот и весь искусственный интеллект.
Адар Кахири, 10 апр. 2019 г.
Шимпанзе, погруженный в глубокие размышления.
ИИ во многом лучше людей.
Прогноз погоды? Проверьте.
Диагностика болезни? Ага.
Шахматы? Конечно!
Этот список можно продолжить, но суть в том, что ИИ лучше нас во многих вещах, кроме ответов на такие вопросы:
Какого цвета цилиндр, который находится слева от золотого металлического предмета, который немного правее большой сферы?
Почему глубокого обучения недостаточно
Модели глубокого обучения довольно хороши для выявления взаимосвязи между входами и выходами. И, в общем-то, все. Будь то обучение с учителем или обучение с подкреплением, входные и желаемые выходные данные четко определены и просты для понимания заданной моделью сети. Это нормально для таких задач, как классификация и даже генерация, но если мы хотим, чтобы модели ИИ могли принимать решения, используя то, что мы называем «здравым смыслом», что на самом деле является абстрактным рассуждением, мы должны дать им возможность рассуждать.
Глубокие рассуждения
Глубокое рассуждение — это область, позволяющая машинам понимать неявные отношения между разными вещами. Например, рассмотрим следующее: «Все животные пьют воду. Кошки - животные». Здесь подразумевается, что все кошки пьют воду, но это никогда не оговаривалось явно. Оказывается, люди действительно хороши в таком реляционном рассуждении и понимании того, как разные вещи соотносятся друг с другом, но это не так легко дается компьютерам, которые работают по строгим, явным правилам.
Итак, как мы можем дать компьютерам способность рассуждать?
Реализация глубокого рассуждения
В этой статье исследователи DeepMind объяснили, как они получили модель глубокого обучения, позволяющую отвечать на вопросы, подобные приведенному в начале статьи, с потрясающей точностью 96%.
Они сделали это, используя 3 сети:
1. Сеть с долгосрочной и краткосрочной памятью (LSTM) для обработки вопроса.
2. Сверточную нейронная сеть (CNN) для обработки изображения.
3. Сеть отношений (RN), чтобы понять, как разные объекты связаны друг с другом.
Давайте рассмотрим, как каждый из этих компонентов помогает решить проблему.
Языковая обработка
LSTM действительно хорошо разбирается в последовательностях из-за ее способности «запоминать» предыдущие части последовательности. Это действительно хорошо, когда вы имеете дело с вопросами и языком в целом, потому что начало предложения может повлиять на значение в целом и/или значение конца в частности. LSTM создает иерархию вопросов, с которыми RN легче работать.
Обработка изображения
CNN действительно хороши в эффективном распознавании особенностей изображений, поэтому исследователи использовали CNN для извлечения всех различных объектов из изображения в виде карты объектов и их характеристик. Так же, как встраивание, производимое LSTM, векторы карты характеристик — это просто более эффективное, чем пиксели, представление объектов и это упрощает работу RN.
Реляционное понимание
После того, как модель обработала вопрос и изображение, она может начать понимать отношения между объектами на изображении и то, как использовать эти отношения, чтобы ответить на вопрос. RN учится выводить отношения, рассматривая потенциальные отношения между всеми парами объектов (например, красный цилиндр и синий куб). Эти выходные данные затем проходят через многослойный перцептрон (MLP), своего рода нейронную сеть с прямой связью, а затем эти выходные данные суммируются и пропускаются через окончательный MLP, который выводит ответ.
Фух, это немного заморочено. Вот диаграмма, которая описывает последовательность операций всей модели:
Эта модель, хотя и относительно проста по структуре, приближает нас на шаг к общему искусственному интеллекту, который может мыслить почти как люди.
Приложения
Вот несколько потенциальных приложений, позволяющих применять модель глубокого рассуждения:
1. Богатое понимание сцены в RL-агентах. Предоставление агентам возможности понять, как связаны различные части их среды, позволит им вести себя более разумно и человечно.
2. Моделирование социальных сетей.
3. Решение абстрактных задач.
Выводы
- Глубокие рассуждения позволяют ИИ понимать абстрактные отношения между разными «вещами».
- Модуль «сеть отношений» можно легко подключить к модели глубокого обучения, чтобы дать ей возможности реляционного мышления.
- Глубокие рассуждения — это следующий шаг на пути к общему искусственному интеллекту.