Привет! Меня зовут Медуза, и в своей жизни я люблю две вещи: музыку и статистику. Я долго думала, как совместить две эти страсти и нашла выход — для того, чтобы написать этот материал, мне пришлось научиться программировать.
Немного предыстории
В апреле 2020 года я разбирала творчество Loqiemean по треклисту с живого концерта «Зомби надо хоронить». Собирать датасет из 22 песен было чудовищно долго и страшно муторно! В этот раз я решила воспользоваться «методом научного тыка», а также «экспертного гуглинга» и собрала код для работы с данными. Теперь я могу использовать его для анализа любых артистов, чье творчество отвечает двум критериям:
- Их тексты песен есть на сайте Genius
- Их треки есть на Spotify.
Но это все на будущее, а пока я покажу, что у меня получилось с первым артистом.
Для первого подробного анализа я выбрала Андрея Пирокинезиса
Мне захотелось посмотреть, какие данные, зависимости и корреляции я могу извлечь из его треков, и как смогу препарировать язык его текстов.
Весь анализ разбит на три части:
- Общий анализ трекографии — обезличенные статистические данные обо всех песнях,
- Частотный анализ — анализ максимально возможного количества текстов песен,
- Чем «Питер, чай, не Франция» отличается от остальных альбомов? Мне не очень зашел последний альбом, и поэтому я захотела сравнить его с другими релизами, но согласно статистическим данным, а не собственным впечатлениям.
Общий анализ трекографии
Для того, чтобы проанализировать все песни, их нужно собрать в одном месте. Я взяла все песни Пирокинезиса на Spotify (их оказалось 142) — это альбомы (LP и EP), синглы, которые не выходили на альбомах, и фиты.
При помощи Spotify я выгрузила данные по этим песням и начала развлекаться.
Первое, что я решила сделать, это посчитать количество фитов. Лидер был мне очевиден — STED.D, а вот с кем еще работал Андрей (и в каких количествах), мне стало любопытно. График ниже иллюстрирует ответ на этот вопрос:
Всего Андрей успел поработать с 18 артистами. В топе по совместным записям оказались STED.D (8 треков), playingtheangel (5 треков) и Aikko (4 трека).
Дальше мое любопытство завело меня на тропу распределения количества песен по годам. Я разделила график на самостоятельные треки и фиты, последние отмечены желтым. Оказалось, что в 2015 году у Андрея не было ни одного фита, а больше всего совместных записей вышло в 2018 году. Больше всего песен в целом вышло в прошлом году. И не удивительно, 2019 для Андрея был довольно успешным.
Затем мне стало любопытно проверить, как менялась средняя длина трека от года к году. Подвержен ли Pyrokinesis влиянию стримингов? И оказалось, что да! Начиная с 2016 года, длительность трека упала на целую минуту.
Частотный анализ
При помощи cайта Genius я смогла выгрузить тексты 118 песен из 142. Скрипт, которым я пользуюсь, выгружает те тексты, где артист обозначен как основной. Поэтому в выборку не попала песня с Муккой «Днями ночами» или с Playingtheangel «Мезальянс», но зато попала «Без промаха» со STED.D.
В 118 песнях оказалось 45184 слова, 9458 из них — уникальные. Я также решила посчитать индекс репетативности (как часто повторяются слова).
Обычно из частотного анализа выкидывают местоимения, потому что они не передают смысла, но мне кажется, что в анализе одного артиста местоимения важны. По ним можно понять, к кому обращается артист, как он выстраивает внутренний мир своих треков. При анализе треков Андрея получился довольно интересный результат.
Преобладание «я» было ожидаемо — в своей основе творчество самоцентрично, Pyrokinesis здесь не исключение (хотя я не ожидала, что «я» будет составлять примерно 2,4% от всех слов). А вот дальнейший результат получился неожиданный. Второе по частоте употребления — местоимение «мы», а следом немного от него отстает «ты». Андрей выстраивает мир в своих песнях в пределах этой триады. Получается, «есть я, есть ты, но, когда мы вместе, это важнее».
Для сравнения:
В апреле я делала похожее исследование по Роме Локимину. Я анализировала треклист с его концерта, в его творчестве второе местоимение это «ты», он много обращается к слушателю.
После этого я не могла не проанализировать самые часто употребляемые части речи в текстах Андрея. Для этого мой код привел все слова к одной исходной словоформе. Когда я просматривала данные, я нашла несколько пунктов, над которыми можно было поработать получше: например слова «девочка» и «девчонка» оказались в разных категориях, хотя слова «солнце» и «солнышко» собрались в одну форму. Начала я с существительных.
Самые часто употребляемые существительные у Пирокинезиса: «мир» (138), «небо» (129) и «жизнь» (126).
Какие интересности я обнаружила:
- Дихотомия «жизнь — смерть» попала в топ самых употребляемых слов. Еще одно слово из похожей дихотомии «рай — ад» тоже попало в список (надо отметить, что слово «ад» встречается 45 раз, а «рай» — всего 15).
- По топу слов сразу же видно сумрачное настроение, которое создает Андрей в своих песнях. Здесь не только «смерть», но и «прах», «пепел» «боль», «судьба» и «кровь».
- В топе присутствует слово «бог». Можно подумать, что это какой-то христианский рэп, но бог в творчестве Андрея не един, а используется скорее для описания представителей разных мифологий и миров.
- Не удивилась, но очень обрадовалась присутствию в топе слова «роза». Этот цветок — один из основных символов творчества Пирокинезиса.
Дальше глаголы! Их привести в одну форму и к одному корню сложнее, поэтому я не стала с этим заморачиваться (в списке встречаются «дать» и «отдать»). Но, несмотря на то, что тут много похожих или слишком популярных глаголов, Андрей смог меня удивить!
- Глагол «мочь» — один из самых популярных в русском языке, но в творчестве Андрея его обгоняет глагол «знать». Глагол «гореть» находится на в списке третьем месте, хотя среди самых популярных глаголов в русском языке он находится ближе к концу.
- В моих списках встретились пересекающиеся смыслы: «гореть» и «огонь», «смерть» и «умереть».
- Интересно, что в список попали «покорить», «сожалеть», «ползти», «плевать», «разбивать» — они вообще не попадают в список популярных глаголов.
Ну и напоследок давайте взглянем на прилагательные:
Самые популярные слова: «большой», «черный», «последний».
- В список попало сразу три цвета: черный, красный и белый.
- Религиозную и околобожественную тематику дополняют прилагательные «святой», «проклятый», «вечный», «стотысячекрылый».
Посмотрев на все три топа, можно заметить, что в них преобладает тема любви («любовь», «любить», «любимый» — одни из самых популярных слов в текстах Андрея, хотя каждый раз они встречаются за пределами пяти самых популярных). Напрашивается вывод, что «любовь» — основная тема творчества Пирокинезиса, но, благодаря метафоричности его языка, она раскрывается намного интереснее, чем в поп-текстах.
Когда я писала этот текст, я переслушала много песен Андрея, и, кажется, нашла строчки из 2015 года, которые буквально суммируют мое исследование:
...Полжизни с черной розой на руке
Принеси мне на могилу пару красных...
Pyrokinesis — Red Roze (2015)
Чем «Питер, чай, не Франция» отличается от остальных альбомов?
Последнее, на что я хотела посмотреть — это чем отличается последний альбом Пирокинезиса от предыдущих. Меня он не восхитил, особенно, после «Моей милой пустоты», но почему? Пала ли я жертвой завышенных ожиданий, или у релиза действительно есть какие-то отличия, которые пришлись мне не по душе?
В первой части анализа я приводила график со средней длиной песни от года к году. Думаю, есть смысл посмотреть, сколько минут длится каждый LP Андрея. Полноформатным альбомом я считаю все записи, на которых от 10 песен.
В «Терновом венце эволюции» 10 треков и длится он 37 минут. А в «Питер, чай, не Франция» 12 треков, но он стал короче на 3 минуты.
Также я решила посмотреть на средний темп релиза, и он оказался выше, чем обычно, выскочил за 130. Я немного удивилась, потому что в сравнении разница кажется не очень большой, но она же из чего-то складывается.
Я решила разложить «Питер, чай, не Франция», и оказалось, что в этом альбоме есть несколько треков с темпом, превышающим 160 bpm: «Чемпионы пепла», «Веснушки» и «Мискузи мадам аутро». В «Моей милой пустоте» темп 160 только у песни «Цветами радуги». На «Терновом венце эволюции» и «Корми демонов по расписанию» треки, превышающие 160 bpm, не обнаружены.
Чтобы объяснить вам следующий график, нужно сначала рассказать, по каким характеристикам Spotify оценивает каждую залитую песню:
- Акустичность (acousticness) — измеряет, акустический трек или нет. Чем выше значение, тем выше вероятность, что трек акустический.
- Танцевальность (danceability) — измеряет, насколько трек подходит для танцев. Спотифай анализирует темп, стабильность ритма, силу бита и регулярность.
- Энергия (energy) — энергичными треками спотифай считает быстрые, шумные, громкие треки. Дэт-метал в этой метрике будет считаться энергичным, а прелюдия Баха нет.
- Преобладание музыки (instrumentalness) — определяет, есть ли в музыке вокал. Если он есть, значит, значение будет близиться к нулю, если же значение выше 0,5, трек, скорее всего, инструментальный.
- Живой звук (liveness) — определяет, есть ли живая аудитория в записи. Концертная запись, где слышно вопли аудитории, наберет выше.
- Настроение (valence) — определяет настроение трека. Чем выше значение, тем больше трек считывается как веселый, счастливый. Если значение низкое, трек грустный, депрессивный или злой.
- Преобладание текста (speechiness) — определяет наличие речи в треке. Показатели от 0.33 до 0.66 указывают, что в тексте есть и музыка, и речь. Если показатель выше 0.66, значит, запись больше похожа на подкаст, декламацию стихотворения или разговор.
Разобрались с показателями, теперь можем посмотреть на лепестковую диаграмму ниже.
Синим обозначен анализ всех песен Пирокинезиса. Видно, что усредненные данные показывают большую акустичность. Это связано с тем, что в дискографии есть акустический мини-альбом (я не добавляла его в отдельную выборку). Желтым обозначен альбом «моя милая пустота», он выбивается за счет большей танцевальности. А еще видно, что «Питер, чай, не Франция» больше похож на «Терновый венец эволюции». Показатель инструментальности практически во всех альбомах стремится к нулю.
Поскольку графики сливаются, я решила наложить друг на друга «Мою милую пустоту» и «Питер, чай, не Франция». У «ММП» все то же преобладание танцевальности, чуть более веселое настроение и более электронный звук, по мнению Спотифай.
Ну и наконец, самое важное — популярность. Мерить ее сейчас не очень релевантно, альбом вышел около месяца назад, к нему все еще приходят свежие слушатели, но посмотреть все равно хочется. Есть смысл измерить этот показатель еще раз спустя несколько месяцев.
Cпотифай измеряет популярность по тому, сколько прослушиваний у трека и насколько это свежие прослушивания (важно не только популярность релиза сразу после выхода, но и частота возвращения слушателей к нему).
Я решила посмотреть популярность альбома по сумме и в среднем. И они дали разные результаты: по сумме лидирует «Моя милая пустота», но по средним показателям — «Питер, чай, не Франция».
Тогда я решила разложить популярность по трекам, чтобы понять, из чего же складывается такой результат (кроме того, что в «ММП» больше песен).
И меня ждал интересный вывод:
Средняя популярность у «Питер, чай, не Франция» действительно выше. Но на «Моей милой пустоте» очень ярко выделяются три хита, вы сами видите их на графике (если не поняли, куда смотреть, то это «Сигаретка без кнопки», «Цветами радуги» и «Черное солнышко»). А на «Питер, чай, не Франция» очевидного хита нет. Видно, что людям (чуть больше, чем все остальное) понравились «Веснушки» и «Зависимость», и все.
Какие выводы можно из этого сделать? Альбом «Питер, чай, не Франция» действительно отличается от предыдущих работ и особенно от полюбившейся мне «Моей милой пустоты». И, хоть отличия не оказались разительными, в ПЧНФ едва ощутимо, но изменился вайб, возможно, это и не дало мне до конца оценить релиз. Ну и на «Питер, чай, не Франция» нет сильного хита, который бы вытащил альбом на новый уровень.
Вот такой получился разбор Андрея Пирокинезиса на буквы и цифры. Пишите в комментарии, каких еще артистов стоит препарировать таким образом!