Или ДЕЛЬТА БЕРРОУЗА.
Очень часто возникает вопрос: а действительно ли тот или иной человек является автором того или иного произведения? Может быть, он просто позаимствовал его у кого-либо ещё. Или попросил/заставил написать за него.
Вслед за этим вопросом автоматически возникает и другой - а действительно ли тот или иной человек НЕ писал это? Но такие проблемы обычно задают те, кому надо.
Как ни странно, помимо чисто человеческого "а мне кажется...", тут огромную роль играет сухая и беспристрастная математическая составляющая. То есть можно любое произведение разложить на элементы, создать его математическую модель, а потом просто сравнить разные модели и сделать вывод о степени их сходства.
Иными словами, когда вы читаете произведение и у вас возникает ощущение чего-то знакомого, дескать, как слог этого автора похож на Набокова или Ерофеева, это не просто интуиция, а результат аналитической работы вашего сознания. Которое может и ошибиться. А вот если доверить анализ компьютеру, будет довольно сложно свести всё к человеческому фактору.
Ровно так поступил австралийский филолог Джон Бёрроуз, который долгие годы занимался компьютерным анализом произведений Джейн Остин и Джона Мильтона. В 2001 году он вывел формулу, позволяющую найти так называемую ДЕЛЬТУ БЁРРОУЗА - меру стилистической близости между текстами.
Например, в 2013 году в Великобритании вышел в свет роман «Зов кукушки» некого Роберта Гэлбрейта, бывшего члена отдела спецрасследований Королевской военной полиции. Через некоторого время читатели высказали подозрение - уж не водят ли нас за нос, ведь по стилю изложения больно похоже на Джоан Роулинг.
Формула Бёрроуза позволила с высокой вероятностью утверждать, что автор - именно она. Через некоторое время писательница сама призналась в этом. После чего издатели назвали её литературный обман виртуозным, а количественным методом атрибуции заинтересовалась широкая публика.
Как же происходит вычисление дельты?
Выглядит это примерно так. Допустим, нам необходимо оценить корпус из m текстов, чтобы найти расстояния между каждыми двумя текстами из него. Обозначим их D1, D2,…,Dm, затем возьмём множество из n словоформ. Для анализа вполне достаточно примерно 200-500 часто употребляемых слов, желательно, без местоимений, но в идеале лучше взять массив из 5-10 тысяч слов.
Затем для каждого текста из корпуса можно найти z-оценку частоты употребления в нём каждой словоформы. Чтобы рассчитать эту оценку для частоты i-ой словоформы (обозначим её wi) в j-ом тексте (Dj), обозначим частоту употребления wi в Dj как fi(Dj) (т.е. fi(Dj)=(количество вхождений wi в Dj)/(количество слов в Dj).
Пусть μi - средняя частота wi по корпусу, а σi - среднеквадратичное отклонение:
Тогда мы можем получить z-оценку (также называемую стандартизированной оценкой):
Рассмотрим какие-нибудь два текста, например, D1 и D2. Посчитаем дельту Бёрроуза, то есть «расстояние» между ними, так:
Таким образом, подставим формулу z-оценки в формулу Дельты, упростим ее и получим следующее выражение:
Мораль: чем меньше Δ(D1, D2), тем ближе по стилю тексты D1 и D2. Более того, если посчитать дельты для всех пар текстов, можно попытаться их классифицировать, сгруппировав по авторам, жанрам или периоду написания.
Источник - https://sysblok.ru/glossary/a-avtor-kto-rassudit-delta-bjorrouza/?ysclid=lv4ytjyn39987579581
(Я зарекался писать тут формулы, но в данном случае, увы, без них не обойтись.)
Как вы уже догадались, после обнародования метода Бёрроуза, его формулу тут же применили для выяснения авторства одного из самых спорных произведений XX века - романа "Тихий Дон". Который, по мнению одних, написал исключительно Михаил Шолохов, по мнению других - донской казан Фёдор Крюков, по мнению третьих - писатель Александр Серафимович, а в Израиле и вовсе пришли к выводу, что автором книги является журналист Вениамин Краснушкин, творивший под псевдонимом Виктор Севский. Также высказывали предположения о причастности к великому таких людей как Булгаков, Платонов, Каверин, Каргин, Голоушев и даже тесть Шолохова - Громославский.
ДЕЛЬТА БЁРРОУЗА показала, что, во-первых, «Тихий Дон» написан одним человеком, следовательно, любые утверждения, будто какие-то главы Шолохов заимствовал из дневников Крюкова, Гумилёва или Булгакова, как минимум, необоснованны. И во-вторых, если сравнить этот роман с другими произведениями Шолохова, можно сделать однозначный вывод: всё это написал именно он. Ну, или предположить, будто Шолохов сам вообще ничего не писал, а только присваивал себе чужое. Что более чем странно, особенно в контексте Нобелевской премии.
А теперь о грустном.
Про изобретателя этой дельты (в некоторых материалах сама методика называется Delta) известно лишь, что Джон Бёрроуз является специалистом по компьютерной лингвистике, работает в Университет Ньюкасла, Австралия, и... всё.
Ни тебе фотографии, ни пикантных подробностей личной жизни, ни даже дня рождения.
Вы можете поддержать канал, перечислив любую доступную вам сумму на кошелёк ЮMoney 4100 1102 6253 35 (или на карту Райффайзенбанка 2200 3005 3005 2776). И поучаствовать в создании книги по материалам этих статей. Заранее всем спасибо!