Найти тему
Leader-ID

О судьбе нейросетей с создателем iPavlov

Пообщались с Михаилом Бурцевым — заведующим лабораторией нейросетей МФТИ — о глубоком обучении, путях развития ИИ, привязке нейросети GPT к логическому представлению о мире и кадровом голоде.

Команда Михаила разрабатывает разговорный искусственный интеллект: открытую библиотеку для обработки естественного языка DeepPavlov. Модели библиотеки можно «пощупать руками» на демостранице DeepPavlov.

Михаил считает, что в ближайшие годы нас ждет бурное развитие ИИ, потому что в этом направлении очень много интересных задач. Одна из них — генерация новостей.

Сегодня в интернете можно найти в основном фейковые новости, написанные нейросетями. Они генерируют текст, похожий на человеческий, но совсем не умеют привязывать его к реальным ситуациям.

Что если такую модель связать с логическим представлением о мире? Например с «Викидатой» — графом, который содержит знания о мире в форме статей «Википедии». Тогда мы получим целого редактора новостей, который уже все знает. Но это половина задачи. По мере генерации настоящих новостей будет развиваться и область детекции фейковых. Так что здесь точно стоит ожидать прорыва.

Еще можно интегрировать в нейросети понимание человеческих целей. Модель, которая может управлять генеративной языковой моделью, привязанной к графу знаний, можно обучить, чтобы она помогала человеку достигать его целей. В таком случае мы получим личного ассистента.

Развитие в этом направлении точно приведет к тому, что через пару лет мы будем записываться в салон к парикмахеру, заказывать столик в ресторане или такси с помощью диалоговых ассистентов, которым будет все равно, на каком языке вы говорите. Они все равно вас поймут.

Не стоит забывать и про тесты для проверки способности искусственного интеллекта понимать человеческий язык. Одним из них является SuperGLUE. Если сейчас некоторые модели достигают 90% на наборах задач, то, может, уже через год мы одолеем планку в 95%.

Все эти задачи будут решены не мгновенно. Но железо развивается очень быстро, поэтому лет через 5–10 удастся объединить нейросетевые языковые модели, графы знаний и обучение с подкреплением. Тогда в понимании машиной человека, по словам Михаила, и случится качественный скачок.

Ребята, дефицит кадров будет огромный, и есть отличный шанс получить новые и интересные результаты, да и оказать влияние на развитие индустрии. Подключайтесь — надо пользоваться моментом!
-2

Старт в глубинное обучение

Советы Михаила Бурцева — как начать погружение в глубинное обучение уже сегодня:

1. Пройти курс от deep learning school.Он подойдет и студентам, и школьникам. Михаил читает там вводные лекции.
2. Посмотреть вводные курсы от университетов, поделать задачки из интернета.
3. Потренироваться в Google Colab — там миллионы примеров задач. Можно без установки софта запустить самые современные решения.
4. Пройти соревнования на Kaggle.
5. Вступить в Open Data Science — русскоязычное сообщество по Data Science, где есть каналы, посвященные deep learning, и люди, готовые помочь советом и кодом.

Полная версия интервью в нашем блоге на Хабре