Многие звукорежиссеры и продюсеры сталкивались с посредственными вокалистами - это больная тема индустрии. Инструменты, способные исправить подобные недостатки, конечно, существуют, но с ними надо ещё уметь работать - удобством они не блещут. Рынок был в ожидании революционного продукта.
И он появился. Инженеры из Университета Джонса Хопкинса утверждают, что разработали новый метод частотной коррекции. Работники престижного заведения дали ему название Diff-Pitcher. Исследователи утверждают, что разработали новый метод частотной коррекции на основе искусственного интеллекта для «повышения естественности и качества коррекции высоты звука» и который «превосходит предыдущие инструменты».
Это невероятно громкое заявление, учитывая то, что подобные технологии ещё очень далеки от идеала. Но создатели Diff-Pitcher, как его называют, уверены, что придумали новый способ, который дает лучшие результаты.
Член команды, аспирант кафедры электротехники и компьютерной инженерии Инженерной школы Уайтинга Джеруй Хай, говорит: «Diff-Pitcher - это генеративная глубокая нейронная сеть, которая выводит технологию частотной коррекции на новый уровень. Его точность и контроль могут не только помочь музыкантам и продюсерам, но и открыть новые возможности в таких областях, как восстановление голоса после различных травм».
Но что в этом особенного, спросите вы? Исследователи утверждают, что, в отличие от общепринятых алгоритмов программного обеспечения для частотной коррекции, которое, по их словам, обучается на парах обработанного и исходного вокала, Diff-Pitcher анализирует спектрограмму исходника, который необходимо исправить. Затем он определяет нужные ноты, прогнозирует необходимые корректировки и преобразует исправленную спектрограмму в готовые аудиоданные.
«Звучит вполне естественно, — говорит Хай, — и, в отличие от старых способов исправления высоты звука, мы также можем регулировать высоту голоса в целом».
Новую технологию представили Хай и ведущий исследователь Мунья Эльхилали, профессор электротехники и вычислительной техники, на семинаре IEEE 2023 года по применению обработки сигналов в аудио и акустике. Они полагают, что она может принести пользу и за пределами сферы производства музыки. «Эта технология может произвести революцию в лечении целого ряда нарушений речи, предлагая ценную поддержку пациентам после ларингэктомии и способствуя восстановлению голоса после инсульта». - говорит Хай.
Вот такие вот технологии уже скоро выйдут в свет. Ваше мнение я жду в комментариях. А также жду лайков, репостов и подписок.