Ученый из Массачусетского технологического института (MIT) Уилл Найт обучил искусственный интеллект сочинять рождественские сказки.
Истории у нейросети получились очень своеобразные.
Суть эксперимента
За основу для создания историй ученый взял 360 рождественских фильмов, а описания к ним – из Википедии. ИИ использовал алгоритм textgenrnn. Его уже применяли для того, чтобы обучить нейросеть созданию костюмов на Хеллоуин.
«Textgenrnn имеет два режима: вы можете использовать буквы для генерации слов в стиле других слов, или же использовать слова для генерации предложений в стиле других предложений», – объяснил принцип работы ИИ Уилл Найт.
У нейросети есть множество настроек, но Уилл Найт использовал только 3 из них:
- количество слоев
- количество эпох
- температура
«Слои относятся к сложности нейронной сети: чем больше слоев она имеет, тем сложнее данные, которые она может обрабатывать. Количество эпох – это количество раз, которое есть у нейросети для просмотра исходных данных для обучения, после чего она может выдавать результаты. И температура: чем она ниже, тем чаще сеть будет выбирать общие слова в наборе данных по сравнению с теми, которые используются реже», – заключил создатель ИИ-сочинителя.
Сказки от ИИ
Вот один сюжет из генераций. Перевод приводим приблизительный, поскольку нейросеть иногда писала несогласованные друг с другом слова и не следовала правилам орфографии и пунктуации.
«Мэри должна найти друзей из магии и остановить Нэйтана от начала Рождества. Серьезные курортные эльфы позаботились о том, чтобы с теннисным рождественским открытием получить умершую Калифорнию, где сурок ждет того, как мудрый дворник травмировал Рождество. Героям нужно выжить в этом шоу не смотря ни на что».
Сюжет выглядит как бред и в отличие от эксперимента 2017 года совсем не весело. Тогда ИИ предлагал названия костюмов на Хэллоуин вроде «сексуального человека из Minecraft».
Также ИИ создал названия к фильмам:
- «Бойцовское Рождество»;
- «Рождественская миля»;
- «Оно Санта».
Причины провала
Исследователь из MIT выяснил, что причина неумело составленных текстов кроется в малом количестве данных для обучения. «Обычно для обучения нейросети нужно в несколько раз больше информации. Другой проблемой было то, что textgenrnn оказался не так хорош в построении предложений по сравнению с альтернативами. Но главная причина заключается в ограничениях генерации предложений. Даже если бы я использовал больше данных и они были бы лучшего качества, задача достигнуть согласованности описания практически невыполнима», – посетовал Найт.