Переход от Google Assistant к эпохе Gemini близится к завершению. Ностальгировать по прежнему виртуальному помощнику можно, однако нельзя отрицать, что приход Gemini существенно изменил то, что искусственный интеллект может сделать для нас.
Понимание языка у Gemini стало значительно лучше. Разговоры ведутся естественно, взаимодействие с приложениями проходит плавно, а интеграция с другими продуктами Google приносит удовольствие. Даже в бесплатном режиме Gemini переигрывает Siri, даже на iPhone.
Тем не менее, есть несколько особенностей, которые поднимают Gemini на совершенно новый уровень. Функция Deep Research — одна из тех полезных возможностей, что я ежедневно использую и каждый раз удивляюсь. В марте Google добавил к арсеналу Gemini еще одну интересную функцию: Аудио Обзоры.
Преобразование всего в подкаст
Представьте, что скучные документы, слишком сложные исследовательские статьи или учебные материалы превращаются в живую двухстороннюю беседу в формате подкаста. Именно это предлагает функция Аудио Обзоры. Она впервые появилась в недооцененном NotebookLM от Google и теперь доступна в основном опыте Gemini на мобильных устройствах и в вебе.
Вам не нужно мучиться с техническими деталями или писать сложные текстовые команды, чтобы получить эти аудио преобразования. Просто загрузите файл через меню вложений, и вы увидите кнопку «Сгенерировать Аудио Обзор» над чат-боксом. Нажмите на неё, и начнется процесс создания подкаста.
Это может занять несколько минут, но пока идет процесс, вы можете переключиться на другое приложение (или окно). Как только работа завершится, вы получите уведомление о готовности подкаста к прослушиванию или распространению.
Аудио обзор обычно представляет собой двухстороннюю беседу с удивительно естественным тоном. Создается ощущение, что вы общаетесь с Gemini Live, который намного естественнее любого чат-бота ИИ, с которым я когда-либо взаимодействовал в режиме голосовой связи.
Я бы сказал, что эти подкасты, сгенерированные ИИ, сделаны довольно хорошо. Однако я предпочитаю их по нескольким причинам. Во-первых, я целый день провожу за компьютером, читаю статьи для исследований и пишу собственные тексты.
Это оставляет мало пространства для работы с дополнительным текстовым материалом, будь он академическим, рабочим или развлекательным. Если бы я мог просто изменить способ взаимодействия с этим материалом, усталость от чтения постепенно исчезла бы.
Аудио подкасты предлагают совершенно новый способ взаимодействия с текстами более погружающим образом. Это подводит нас ко второму преимуществу — сенсорной стимуляции. Эта концепция хорошо задокументирована и изучена в области академической науки и профессионального обучения.
Как это помогло мне?
Усталость от текста оставляет свой след. Даже увлекательная работа кажется рутинной задачей, которую нужно преодолеть. Однако взаимодействие с той же работой через другой сенсорный носитель помогает избежать перегрузки текстами. Это действительно полезно в нескольких отношениях.
«Вовлечение нескольких чувств укрепляет память. Когда мы слушаем и действуем — будь то чтение, написание или выполнение задач — мозг строит более прочные связи, что облегчает запоминание в дальнейшем», — говорит Ясир Насим, эксперт в области лингвистики, чьи исследования сосредоточены на модернизации методик преподавания.
Насим, который в настоящее время является экспертом по учебным программам в ведущей образовательной технологической компании, отмечает, что нельзя полагаться только на один носитель для обучения. Вместо этого он предлагает комбинировать разные методы для максимальной пользы, от эмоционального восприятия до запоминания.
Исследования, опубликованные в журнале Computers & Education, также подчеркивают, что студенты считают аудиофайлы лучшим материалом для обучения и повторения. Гибкость и сенсорное разнообразие влияют на их предпочтение подкастов перед другими форматами.
«Истинное понимание и долговременное запоминание происходят, когда слушание сочетается с визуальными образами, дискуссиями или практическими действиями», добавляет Насим. Мой собственный опыт с аудио обзорами Gemini подтверждает его мнение. Я гораздо лучше запоминаю знания, усвоенные через аудио подкасты, чем через чтение того же материала.
Видите, эти аудио подкасты — это не просто переход текста в аудио. Они разбивают скучную стену текста на беседу между двумя людьми, где вы фактически являетесь единственным слушателем. Это особенно полезно для текстовых материалов, которые не вызывают мгновенного интереса и не побуждают к немедленному чтению.
В моем недавнем эксперименте аудио подкаст от Gemini помог мне лучше понять значимость статьи, обсуждающей «рамки для интерпретируемого нейронного обучения на основе локальных информационно-теоретических целых функций». Проще говоря, исследование касалось того, как организуют себя нервные клетки.
Понимаете, о чем я?
Удобство выше всего
Удобство играет важную роль в усвоении информации. Энтузиазм и интерес к процессу – также значительные факторы. Согласно статье, опубликованной в журнале Computers in Human Behavior, подкасты «повышают удобство, гибкость и доступность информации и знаний». Я быстро это осознал.
Живя в столице, я ежедневно провожу от 2 до 3 часов в пробках или в транспорте. Однако больше всего меня беспокоит потерянное время. Аудиоматериалы для обучения предлагают самый удобный способ эффективно использовать это время.
С Gemini вы получаете еще одно важное преимущество. Вам не нужно полагаться на аудиоверсии книг, новостных статей или учебных материалов. Вы просто загружаете любой доступный текст, а Gemini превращает его в разговор в формате подкаста.
Существуют многочисленные междисциплинарные исследования, подтверждающие преимущества аудиоподхода к обучению. Дело не только в прослушивании, а и в том, как информация разбивается и представляется более доступным образом.
«Некоторые отметили, что им нравится, когда мы предлагаем что-то, что нельзя прочитать в газетах. Им нравится, что … мы пытаемся представить себя по-другому», — говорит редактор новостей в одной из исследовательских статей. Эта статья, полученная из Университета Сиракуз, была опубликована в 2006 году, в самом начале подкаст-движения.
На 2025 год подкасты стали настоящим феноменом для потребления информации — от образовательных материалов до развлекательных. По данным Pew Research Center, почти половина американцев слушали подкасты. Более половины опрошенных слушали подкасты для обучения, развлечения или чтобы получить аудиоматериал во время выполнения других дел.
Почти треть хотела услышать мнения других людей, а еще одна такая же группа интересовалась новостями и текущими событиями. Мой интерес не уходил слишком далеко от упомянутой схемы. Для длинных журналистских историй или расследований я часто считал их подкаст-версии более удобными.
Более эффективное взаимодействие
Интересно, что подкасты также приводят к практическим изменениям. Примерно две трети слушателей заинтересовались книгой или фильмом после того, как услышали подкаст, более половины аудитории начали следить за людьми в социальных сетях, и треть из них изменила образ жизни, например, начала заниматься спортом или поменяла диету.
Исследование, опубликованное в Journal of Social Media Marketing, подчеркивает такие концепции, как замещение медиа и функциональное сходство в контексте прослушивания медиа и готовности аудитории. Основная идея заключается в том, что пользователи оценивают носитель и выбирают тот, который им больше подходит.
«Из-за уникальности содержимого подкастов влияние на готовность слушать и замещение медиа является положительным, что говорит о том, что уникальные, качественные и разнообразные материалы заставляют людей хотеть слушать подкасты», — утверждает статья. Я тоже могу это подтвердить.
pic.twitter.com/mhDugg1zdg
— Nadeemonics (@nsnadeemsarwar) 30 марта 2025
В последние дни я «подкастировал» множество исследовательских работ, обсуждающих влияние содержания клетчатки, мяса и упакованных продуктов на сон, когнитивное здоровье и здоровье кишечника. В отличие от явно технического языка научных статей, беседа двух ведущих, анализирующих выводы с «эмоциональным» и «убедительным» тоном, производила на меня гораздо более глубокое впечатление.
Думайте об этом так: изучение социальных этик или культурных нюансов через книгу. А потом, спустя много лет, видеть это в действии собственными глазами. Или представьте изучение иностранного языка по книге в одиночку и разницу, когда вы изучаете его у человека, который передает все эти знания прямо к вам.
Такой подход дает лучшие результаты. Это связано с тем, что комбинированный эффект многосенсорного взаимодействия ускоряет процесс обучения или делает его более эффективным. Аудио обзоры Gemini оказали аналогичное влияние и очень помогли мне.
Несколько недостатков
Несмотря на то, что это звучит продуктивно, аудио обзоры Gemini не идеальны. Они могут искажать истинный смысл хорошо написанной истории в своем стремлении к «подкастированию» или упускать второстепенные детали. Есть и функциональные странности. Длина аудио обзора, связанная с глубиной исходного материала, может быть довольно случайной.
Например, когда я загрузил 260-страничную книгу по спряжению и морфологии глаголов в персидском языке, аудио обзор, сгенерированный Gemini, длился всего чуть более семи минут. Он качественно охватывал наиболее важные части, но упускал более тонкие детали.
В другом случае я перевел документ Deep Research длиной четыре страницы в аудиоподкаст. Длительность этого подкаста составила около 13 минут. К сожалению, автоматизированная функция Gemini не позволяет вам настраивать длину или глубину беседы аудио обзора.
Если вы используете Google NotebookLM, где функция аудио обзора впервые появилась, вы можете задать параметры, которые определят, насколько глубоким будет подкаст. Я на днях сгенерировал аудиоподкаст продолжительностью 59 минут на NotebookLM.
Gemini пока не дает возможности делать то же самое.
Также стоит отметить языковой барьер, так как Google сейчас завершает работу над функционалом вне английского языка. Еще одной проблемой является английское произношение. Например, ИИ-ведущий подкаста неправильно произнес персидское слово «Raf-thin» как «Raaf-tin».
Для неподготовленного уха, не знакомого с нюансами перевода английского на персидский и тем, как акценты меняют восприятие слов на другом языке, ИИ-ведущие подкастов могут показаться совершенно бессмысленными.
В конечном итоге, мой опыт с аудио обзорами Gemini показывает, что они не являются революцией. Они просто предлагают другой, более увлекательный формат для взаимодействия с контентом. Это не всегда работает, но определенно помогает справиться со скукой от чтения страниц текста, которые иначе заставляли бы вас засыпать.
Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!
Вы также можете читать наши материалы в:
- Telegram: https://t.me/gergenshin
- Яндекс Дзен: https://dzen.ru/gergen
- Официальный сайт: https://www-genshin.ru