Найти в Дзене

Meta представила SAM Audio — инструмент для точечной сегментации звука.

Значит так, братцы и сестрицы. Пока мы тут все пытались убрать лай собаки из подкаста в Adobe Audition три часа подряд, Meta взяла и выкатила инструмент, который делает это за пару кликов. Называется SAM Audio, и это, по сути, фотошоп для звука. Только в сто раз проще. Представьте: вы сняли видео на концерте любимой группы. Звук, понятное дело, каша полная. Там и гитара, и вокал, и какой-то мудак рядом орет что-то в телефон, и кто-то пиво уронил. Раньше чтобы вытащить оттуда нормальный звук, надо было либо быть профессионалом, либо забить и слушать эту кашу. SAM Audio позволяет изолировать гитару или вокал одним кликом, используя текстовые промпты для фильтрации дорожного шума или удаления лая собаки из всей записи подкаста. То есть буквально пишешь "хочу только гитару", и модель вырезает только гитару. Магия? Нет, ИИ. Ключевые возможности модели: Главная особенность — унифицированный подход к управлению. Выделять нужный аудиофрагмент можно тремя способами (в том числе комбинируя их):
Оглавление

Meta научила ИИ вырезать звуки как хирург: знакомьтесь с SAM Audio.

Значит так, братцы и сестрицы. Пока мы тут все пытались убрать лай собаки из подкаста в Adobe Audition три часа подряд, Meta взяла и выкатила инструмент, который делает это за пару кликов. Называется SAM Audio, и это, по сути, фотошоп для звука. Только в сто раз проще.

16 декабря 2025 года компания представила первую в мире унифицированную мультимодальную модель для сегментации аудио. Звучит сложно, но на деле все просто: теперь можно вырезать любой звук из любой записи, не будучи звукорежиссером с двадцатилетним стажем.

Представьте: вы сняли видео на концерте любимой группы. Звук, понятное дело, каша полная. Там и гитара, и вокал, и какой-то мудак рядом орет что-то в телефон, и кто-то пиво уронил. Раньше чтобы вытащить оттуда нормальный звук, надо было либо быть профессионалом, либо забить и слушать эту кашу.

SAM Audio позволяет изолировать гитару или вокал одним кликом, используя текстовые промпты для фильтрации дорожного шума или удаления лая собаки из всей записи подкаста. То есть буквально пишешь "хочу только гитару", и модель вырезает только гитару. Магия? Нет, ИИ.

Ключевые возможности модели: Главная особенность — унифицированный подход к управлению. Выделять нужный аудиофрагмент можно тремя способами (в том числе комбинируя их): Текстовый запрос: Достаточно описать объект (например, «голос», «шум ветра», «гитара»), и модель выделит соответствующую дорожку.

Визуальный выбор: При работе с видео можно кликнуть на объект в кадре, и система изолирует звук, который он издает.

AM Audio, как унифицированная модель, способна идентифицировать и редактировать любой звук. Один инструмент для всех задач. Причем работает он интуитивно, как люди естественно думают о звуке, а не как думают разработчики аудиософта.Качество тоже на высоте. Meta утверждает, что создала лучшую универсальную модель для сепарации аудио, и судя по демкам, это не просто маркетинг.

Для кого это и где применять;

Монтажеры и видеоблогеры. Убрать фоновый шум, изолировать речь, вырезать случайные звуки. Раньше на это уходили часы, теперь минуты.

Официальная страница проекта: about.fb.com/news/2025/12/our-new-sam-audio-model-transforms-audio-editing/. Там же можно почитать техническую документацию, если вам это зачем-то нужно.

Минусы (потому что без них никак)

Нужно железо. Модель оптимизирована под GPU, на обычном компьютере без нормальной видеокарты может тормозить. Хотя для облачной обработки в Playground это не проблема.

-2