Напомню о книге Бена Блатта "Любимое слово Набокова - лиловый", посвящённой применению статистики в исследовании литературы. Вообще книг о количественных методах в литературоведении на русском языке, доступных и интересных широкому кругу читателей, раз-два и обчёлся. Вот эта книга Блатта, сборник статей Франко Моретти "Дальнее чтение" и вроде бы всё. Моретти сочинил сборник эссе, который читается как приключенческий роман, а Блатт с помощью компьютера проанализировал каноничные тексты и популярную массовую литературу и выяснил общее и особенное в них, там куча графиков, диаграмм и распределений.
Бен Блатт в исследовании литературных произведений использует методы статистики и программу для анализа естественных языков (natural language toolkit).
В первой главе он с помощью этих инструментов пытается выявить взаимосвязь между использованием наречий на "-ly" (тут стоит уточнить, что весь материал в книге есть результат исследования англоязычных текстов) и качеством литературного текста. Как следует из его слов, частота использования подобных наречий в англоязычной литературной традиции - такой же дурной тон, как и обилие причастных оборотов и прилагательных у нас. Но есть ли подобная взаимосвязь на самом деле? Он анализирует тексты англоязычных Нобелевских лауреатов, а также тексты, которые эксперты включили во всякие списки лучших и великих романов, и считает наречия. Затем делает подобную выборку по "не великой" литературе, а именно анализирует количество наречий в сопоставимом объеме текстов фанфиков. И выясняет, что количество таких наречий в фанфиках действительно в разы больше, чем в романах Стейнбека, Мелвилла и прочих. Меньше всего таких наречий в самых лучших текстах Хемингуэя и Твена.
Добавлю, что частота использования наречий в книгах Джоан Роулинг, которую многие считают писателем с безупречным литературным стилем, сопоставима вовсе не с Хемингуэем, а с фанфиками (у Роулинг 140 наречий на 10 тысяч слов, у медианного автора фанфиков - 156 наречий, у Хемингуэя - 80). Более подробно о его методике и нюансах ее применения стоит читать самим, все же я тут в одном абзаце пересказала содержание 30 страниц.
В одной из глав Блатт рассказывает, как он и в самом деле нашел любимые слова многих авторов. Вот какие условия он сформулировал:
- Слово должно присутствовать в половине книг автора
- Оно встречается минимум 1 раз на 100 тысяч слов при анализе книг автора
- Слово не должно быть очень редким: частота его употребления в Историческом корпусе американского английского языка не должна быть меньше 1 раза на 1 миллион слов.
- Это не имя.
Интересно получилось с Набоковым, который, как известно, был синестетом:
"Его любовь к слову лиловый необычна (частота использования в 44 раза превышает частоту в Историческом корпусе), но стоит сказать, что и его любовь к цветам тоже необычна. Если взять названия цветов стандартной пачки из 64 карандашей марки Crayola и поискать их в работах Набокова, то получится, что он использовал примерно 460 слов, обозначающих цвета, на каждый 100 тысяч слов, а это поразительно много."
У некоторых авторов "любимые слова" характеризуют не специфику их мировосприятия, а ту книжную вселенную, о которой они пишут, или особенности сюжета.
"Топ-3 слов у Джейн Остин - учтивость, увлеченный и неблагоразумие, у Агаты Кристи - следствие, алиби, страшный. У авторов типа Дж. Роулинг слова в большей мере отражают вселенную, а не как таковые ее любимые слова. Топ-3 таких слов в Гарри Поттере - палочка, волшебник и зелье."
А Рэй Бредбери очень любил слова "корица", "мята" и другие душистые пряности. Они у него встречаются чаще, чем где-то еще.
#нон фикшн #литературоведение #научно-популярная книга #научно-популярная литература #читает_шафферт