Найти тему
Социология...

Когда роботы читают книги (№4)

Фото

Группа компьютерных лингвистов и литературоведов из Колумбийского университета решила исследовать это утверждение, используя программное обеспечение, которое создало диалоговую социальную сеть из корпуса из 60 романов 19-го века.

Программное обеспечение анализировало каждое предложение с точки зрения его синтаксиса, а затем находило ссылки на людей. Он также отмечал отрезки цитируемой речи и приписывал цитаты спикерам. Это позволило системе определить, кто с кем разговаривал. Хотя теория Моретти предсказывала обратную корреляцию между количеством диалога и количеством персонажей, эти ученые не нашли такого статистически значимого эффекта. Вместо этого они обнаружили, что повествовательный голос, такой как повествование от первого или третьего лица, более важен, чем обстановка в городской или сельской среде.

Персонажи - еще одна область, созревшая для эмпирического пересмотра. Читатели часто имеют сильную интуицию о вымышленных фигурах. Мы распознаем отпечаток отдельного автора, считая персонажей, скажем, Диккенскими или принадлежащими Кафке. Нам также известно, что персонажи могут попадать в определенные функциональные классы в разных работах. Понятно, что такой злодей, как лорд Волан-де-Морт, больше похож на графа Дракулу, чем на своего противника, героя Гарри Поттера.

Вычислительный лингвист Дэвид Бамман, в настоящее время работающий в Калифорнийском университете в Беркли, и его коллеги разработали базу данных из более чем 15 000 романов для создания байесовской статистической модели, которая могла бы предсказывать различные типы символов. Они использовали такие функции, как действия, в которых участвует человек, объекты, которыми он обладает, и их атрибуты. Система смогла идентифицировать случаи, когда два символа одного и того же автора оказывались более похожими друг на друга, чем тесно связанные символы другого автора. Таким образом, система обнаружила, что Уикхем в «Гордости и предубеждении» Джейн Остин (1813) напоминает Уиллоуби в ее «Чувстве и чувствительности» (1811) , «больше чем любой персонаж напоминает мистера Рочестера в фильме Шарлотты Бронте Джейн Эйр (1847).

Они могут обнаружить траектории из базы данных из 1300 романов — это займет у литературоведов огромное количество времени.

Компьютер также может определить, когда главные герои одного автора отличаются, например, от того, что они более продуманны. Их система предполагает, что Элизабет Беннет в «Гордости и предубеждении», одном из самых популярных персонажей Остин, напоминает Элинор Дэшвуд в «Чувстве и чувстве» больше, чем любой другой персонаж напоминает глупую, одержимую браком мать Элизабет, миссис Беннет. Трудно указать человеку, что лежит в основе этой научной интуиции, но компьютеру не составит труда обнаружить и проверить их.

Алгоритмы также становятся искусными в выявлении запутанных переплетений отношений персонажей. Например, ученый-компьютерщик Мохит Айер и его коллеги из Университета Мэриленда разработали систему, которая, прочитав «Дракулу» Брэма Стокера (1897), обнаружила правильную траекторию отношений между Артуром и Люси, которая начинается с любви и заканчивается убийством. Их метод может правильно обнаружить множество других траекторий из базы данных более чем 1300 романов - выводов, которые потребуются литературным ученым огромное количество времени, чтобы обнаружить это самостоятельно.

Нетрудно представить краткосрочный сценарий, в котором такой персонаж, как Робин Гуд, может отслеживаться во времени по нескольким текстам. Он начинает как головорез, антиклерикальный преступник, который грабит богатых, чтобы помочь бедным; переходит в свое воплощение 19-го века в качестве регионального героя, сражающегося с норманнами; и заканчивается как лиса в фильме Диснея. Для ученого, настроенного на культурный поворот в литературоведении, детали трансформации Робина Гуда во времени могут раскрыть факты о классовых конфликтах, взаимодействии литературы и власти, а также ограничениях и давлениях массовых развлечений.

В 1928 году русский структуралист Владимир Пропп опубликовал список из 31 повествовательного архетипа или «функции», которые лежат в основе общих русских народных сказок. Например, в повествовательной функции «Злодейство» злодей похищает кого-то, а в «получении магического агента» персонаж может предоставить себя в распоряжение героя.

Может ли алгоритм сегодня генерировать и улучшать повествовательные функции Проппа?