Работает сразу тремя способами: — По текстовому промпту: пишите, какой звук нужен — голос, инструмент, шум — и нейронка выделяет только его. По визуалу: достаточно нажать на источник звука в кадре. Нейросеть понимает, что именно вы выбрали, и изолирует этот аудиопоток. — По временным отрезкам — выбираете фрагмент аудио или видео и указываете нужный участок, а ИИ сама находит этот звук и выносит его на отдельную дорожку. Забираем здесь, а опенсорс код тут. Telegram: @Age_of_it