Добавить в корзинуПозвонить
Найти в Дзене
Герман Геншин

Google Gemini теперь "читает" аудио — вот что скрывают ваши записи на самом деле!

В Google Gemini наконец появилась поддержка загрузки и анализа аудиофайлов. Искусственный интеллект теперь понимает популярные форматы — MP3, M4A, WAV — и может не только переводить речь в текст, но и сокращать длинные записи, выделять главное и быстро находить ключевые моменты. Эта функция уже доступна на Android, iOS и в веб-версии. Просто нажмите на иконку «плюс» в мобильном Gemini или выберите «Загрузить файлы» на сайте, а затем отправьте нужный аудиофайл со своего устройства. Дальше всё за вас сделает ИИ — анализирует запись и поможет найти важные фрагменты в интервью, встречах, лекциях или даже в личных заметках. Есть, правда, небольшие ограничения: на бесплатном тарифе общая продолжительность загружаемых и анализируемых записей ограничена 10 минутами. Для сравнения — ни один другой бесплатный сервис для расшифровки столько не даёт, так что Google действительно щедр. Существуют и другие лимиты. За раз можно загрузить до 10 файлов любого поддерживаемого формата. Сюда же входят па

В Google Gemini наконец появилась поддержка загрузки и анализа аудиофайлов. Искусственный интеллект теперь понимает популярные форматы — MP3, M4A, WAV — и может не только переводить речь в текст, но и сокращать длинные записи, выделять главное и быстро находить ключевые моменты.

Эта функция уже доступна на Android, iOS и в веб-версии. Просто нажмите на иконку «плюс» в мобильном Gemini или выберите «Загрузить файлы» на сайте, а затем отправьте нужный аудиофайл со своего устройства. Дальше всё за вас сделает ИИ — анализирует запись и поможет найти важные фрагменты в интервью, встречах, лекциях или даже в личных заметках.

Есть, правда, небольшие ограничения: на бесплатном тарифе общая продолжительность загружаемых и анализируемых записей ограничена 10 минутами. Для сравнения — ни один другой бесплатный сервис для расшифровки столько не даёт, так что Google действительно щедр.

Существуют и другие лимиты. За раз можно загрузить до 10 файлов любого поддерживаемого формата. Сюда же входят папки с кодом (до 5 000 файлов), репозитории GitHub и ZIP-архивы (до 10 файлов внутри архива). Новый аудиоинструмент не увеличил этот лимит, так что загруженные аудиофайлы тоже входят в эти 10 слотов.

Если используете Gemini для расшифровки, советую перепроверять результат: выгрузите текст обратно в ИИ и спросите, нет ли в нём информации, которой не было в исходной записи. На длинных файлах искусственный интеллект пока может ошибаться и «придумывать» детали, поэтому лучше быть внимательнее и не доверять итогам слепо.

-2

А теперь главное: загрузив аудиофайл, вы получите не просто расшифровку. ИИ выделит суть, определит разные голоса, подскажет ключевые фразы и задачи. Обычная запись превращается в структурированный документ, в котором удобно искать и находить нужное.

Для тех, кому важны большие объёмы, Google предлагает реальное преимущество: владельцы платных подписок Google AI Pro или AI Ultra могут работать с записями до 3 часов. Это большой плюс для тех, кто занимается подкастами, длинными интервью или обучающими семинарами — сервис теперь справится даже с масштабными проектами, а Pro-подписка стоит всего 2 000 рублей в месяц, что особенно выгодно для бизнеса.

Я уже испытал эту функцию на себе — постоянно вставляю ссылки на YouTube-ролики в Gemini, чтобы быстро находить нужные моменты в длинных видео. А теперь, когда ИИ так тонко разбирается в аудио, уверен: новая возможность пригодится абсолютно каждому!

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Премиум подписка - это доступ к эксклюзивным материалам, чтение канала без рекламы, возможность предлагать темы для статей и даже заказывать индивидуальные обзоры/исследования по своим запросам!Подробнее о том, какие преимущества вы получите с премиум подпиской, можно узнать здесь

Также подписывайтесь на нас в: