Найти в Дзене
О звуках и словах

Почему даже самая умная нейросеть пишет плохие стихи

В прошлом году компания SberDevices, которая в Сбере занимается самыми высокими технологиями и умными устройствами, рассказала на Хабре, как учит нейросеть GPT-3 генерировать стихи. Это не первый поэтический эксперимент Сбера. В 2017 Рунет смеялся над «Одой Сбербанку», которую написал искусственный интеллект. Произведение начиналось так: "Когда во мне счастья ликованье,
Скажу, преодолев страх признанья:
Сбербанк – светило на века в стране!" И продолжалось в том же духе. Полный текст оды можно прочитать здесь. Надо признать, что с тех пор нейросеть несколько продвинулась в стихосложении. Разбираемся, можно ли считать ее творения настоящей поэзией. Пример 1: Гроза и седая стужа "Люблю грозу в начале мая
Седую стужу в летний зной
И солнцем землю заливая
Весна придёт в мой край родной." Чем это было вдохновлено, догадаться несложно: "Люблю грозу в начале мая,
Когда весенний, первый гром,
Как бы резвяся и играя,
Грохочет в небе голубом" Содержание сохранить нейросети не удалось: перечисляя

В прошлом году компания SberDevices, которая в Сбере занимается самыми высокими технологиями и умными устройствами, рассказала на Хабре, как учит нейросеть GPT-3 генерировать стихи.

Это не первый поэтический эксперимент Сбера. В 2017 Рунет смеялся над «Одой Сбербанку», которую написал искусственный интеллект.

Пока над творениями нейросети можно только посмеяться
Пока над творениями нейросети можно только посмеяться

Произведение начиналось так:

"Когда во мне счастья ликованье,
Скажу, преодолев страх признанья:
Сбербанк – светило на века в стране!"

И продолжалось в том же духе. Полный текст оды можно прочитать здесь.

Надо признать, что с тех пор нейросеть несколько продвинулась в стихосложении. Разбираемся, можно ли считать ее творения настоящей поэзией.

Пример 1: Гроза и седая стужа

"Люблю грозу в начале мая
Седую стужу в летний зной
И солнцем землю заливая
Весна придёт в мой край родной."

Чем это было вдохновлено, догадаться несложно:

"Люблю грозу в начале мая,
Когда весенний, первый гром,
Как бы резвяся и играя,
Грохочет в небе голубом"

Содержание сохранить нейросети не удалось: перечисляя времена года, поэт с искусственным интеллектом явно сбился с мысли. С рифмой все более или менее в порядке. Но звучит ли это как настоящие стихи? Мы проверим с помощью Phonotext – специального сервиса для исследования звуковой организации текста.

Phonotext – сервис для автоматического измерения звуковой связности текста и выявления звуковых повторов. Он не просто выделяет одинаковые слоги или созвучия, а помогает обнаружить повторы и связи, которые не бросаются в глаза. Для их выявления ученые использовали непростые формулы. К счастью, для того чтобы пользоваться сервисом, нам ничего рассчитывать не нужно: все делается автоматически.

Вот как выглядит стихотворение, написанное нейросетью:

Кажется, что повторов тут немало. Но самая сильная цепь повторов связывает только последнюю строфу.

Совсем иначе Phonotext видит строфу Тютчева:

У Тютчева сильная цепь связывает всю строфу
У Тютчева сильная цепь связывает всю строфу

Здесь сильнейшая звуковая цепь связывает всю строфу, двигаясь от начала строки к ее концу, а потом вновь к началу.

Когда выделено несколько цепей, видно, как по-разному формируется звуковая ткань стиха. Первые же слова строфы Тютчева – «люблю грозу» – создают фонетическое напряжение, которое позже поддержат и усилят «первый гром», «как бы резвясь», «играя», а потом подхватит «грохочет». У нейросети такой выразительности не получилось: начало стихотворения лишено фонетической поддержки, поэтому оказывается более слабым.

Нейросетевому стихотворению определенно недостает поэтической звучности. Но, может, это случайная неудача?

Пример 2: Жгучие мысли туч

У нас есть материал для еще одного сравнения. Нейросети Сбера дали строку Пушкина и позволили продолжить ее. Получилось вот что:

"Мчатся тучи, вьются тучи
Опускается рассвет
Мысли пламенные жгучи
И весны тревожный след"

Вспомним оригинал:

"Мчатся тучи, вьются тучи;
Невидимкою луна
Освещает снег летучий;
Мутно небо, ночь мутна."

У нейросети самая сильная цепь звуковых повторов ограничена первой строкой, которая к тому же оказывается никак фонетически не связанной с остальным стихотворением. В продолжении картина несколько интереснее. В стихотворении Пушкина звуковая связность гораздо выше, это хорошо видно на иллюстрации.

Для наглядности мы отсортировали звуковые цепи по их силе: от самой сильной до самой слабой. Этот показатель не универсален – фоносиллабическая сила одного и того же сочетания может меняться в зависимости от нескольких факторов. Поэтому в данном случае цепь, построенная на звуках [ТЧ] у Пушкина оказывается сильнее, чем аналогичная в стихотворении нейросети.

Не будем делать глобальных выводов по двум «произведениям». Учатся нейросети сейчас быстро, а поэзия для них – скорее хобби, чем основной род деятельности. Есть, к чему стремиться! Пока же звуковая ткань стиха у нейросети расползается, а ритма и рифмы недостаточно, чтобы замаскировать недостатки в ней.