Найти в Дзене
Герман Геншин

Google Gemini теперь может превращать почти всё в подкаст

Существует мнение, что вы никогда не находитесь дальше чем на шесть футов (примерно два метра) от крысы, и в наше время то же самое можно сказать о подкастерах. Кажется, что почти каждый на планете либо ведет подкаст, либо планирует его запустить. С помощью Google Gemini вы можете создавать свои собственные подкасты, используя функцию под названием "Аудио Обзоры". Вам лишь нужно загрузить документ, и Gemini создаст короткий подкаст, углубляющийся в содержание загруженного материала с участием двух ведущих ИИ. Аудио Обзоры — это новая функция в Gemini, ранее доступная в приложении Google NotebookLM, которая использует искусственный интеллект для создания заметок. Эта функция умеет уникально резюмировать информацию. Вместо того чтобы предоставлять скучное текстовое резюме, Аудио Обзоры генерируют аудиофайл подкаста, в котором два ИИ-ведущих обсуждают информацию, которую вы хотите резюмировать. Ведущие ведут диалог, обсуждая тему, которую они резюмируют, и задают друг другу вопросы, чтоб
Оглавление

Краткое содержание

Существует мнение, что вы никогда не находитесь дальше чем на шесть футов (примерно два метра) от крысы, и в наше время то же самое можно сказать о подкастерах. Кажется, что почти каждый на планете либо ведет подкаст, либо планирует его запустить.

С помощью Google Gemini вы можете создавать свои собственные подкасты, используя функцию под названием "Аудио Обзоры". Вам лишь нужно загрузить документ, и Gemini создаст короткий подкаст, углубляющийся в содержание загруженного материала с участием двух ведущих ИИ.

Что такое Аудио Обзоры в Google Gemini?

Аудио Обзоры — это новая функция в Gemini, ранее доступная в приложении Google NotebookLM, которая использует искусственный интеллект для создания заметок. Эта функция умеет уникально резюмировать информацию. Вместо того чтобы предоставлять скучное текстовое резюме, Аудио Обзоры генерируют аудиофайл подкаста, в котором два ИИ-ведущих обсуждают информацию, которую вы хотите резюмировать.

-2

Ведущие ведут диалог, обсуждая тему, которую они резюмируют, и задают друг другу вопросы, чтобы углубить свое понимание ключевых моментов. В результате получается нечто похожее на настоящий подкаст с двумя информированными собеседниками, обсуждающими актуальные темы.

В ходе тестирования Gemini создавал Аудио Обзоры продолжительностью от пяти до пятнадцати минут в зависимости от объема материалов в загруженных документах. Например, 15-минутный подкаст был создан на основе 146-страничного руководства по фотоаппарату SLR, тогда как даже одностраничный PDF с расписанием сбора мусора генерировал подкаст продолжительностью пять минут.

Как использовать GarageBand для записи подкаста

Кроме того, вот несколько рекомендаций по лучшим инструментам, когда вам нужна большая гибкость.

Что можно использовать для генерации Аудио Обзоров?

Вы можете создать Аудио Обзоры из различных источников в Gemini. Загрузив документ, вы получите возможность превратить содержащиеся в нем данные в персонализированный подкаст. Это не обязательно должны быть текстовые документы; можно загрузить презентацию Google Slides, и Gemini создаст Аудио Обзор на основе содержимого слайдов.

Другой полезный вариант — использовать функцию генерации Аудио Обзоров из отчета Deep Research. Deep Research — это функция, которая создает отчет по любому выбранному вами вопросу, разрабатывая план исследований, находя соответствующий контент в интернете и собирая найденную информацию в отчет. Результаты представлены в виде тщательно составленного письменного ответа, который разбирает всё, что было обнаружено, но такие отчеты часто бывают довольно длинными и не слишком увлекательными.

-3

Однако после создания отчета Deep Research вы можете попросить Gemini превратить его в Аудио Обзор. Таким образом, вместо того чтобы читать весь отчет, вы можете просто расслабиться и послушать, как два ИИ-подкастера обсуждают его. Это может существенно облегчить восприятие информации из отчета, не погружаясь в детали.

Аудио Обзоры представляют собой отличный способ извлечь информацию из веб-страниц с большим объемом данных, но в настоящее время нет возможности генерировать Аудио Обзор по веб-ссылке. Тем не менее, вы можете скопировать содержимое в текстовый файл или сохранить содержимое веб-страницы в формате PDF, и Gemini с удовольствием создаст Аудио Обзор. Я сохранил страницу Википедии о истории Бразилии в формате PDF, и Gemini создал подкаст на основе этого файла, обсуждая историю Бразилии, что оказалось познавательно и информативно.

Reddit — это Википедия человеческого опыта

Есть причина, по которой так много людей дополняют свои поиски в Google словом "Reddit".

Вы не можете генерировать Аудио Обзоры из большинства файлов изображений, однако я заметил, что если сохранить изображения в формате PDF, система хотя бы попытается создать Аудио Обзор из файла. Если в изображении нет читаемого текста, генерация Аудио Обзора не удастся. Если же текст имеется, всё будет работать; я смог заставить ИИ-ведущих подкаста провести увлекательное и глубокое обсуждение PDF-изображения с расписанием сбора мусора в моем районе.

Как создать Аудио Обзор

Когда вы загружаете документ в Gemini, нажав на значок " ", должно появиться предложение над окном запроса, на которое можно нажать, чтобы сгенерировать ваш Аудио Обзор. Если оно не появляется, просто попросите Gemini создать Аудио Обзор на основе документа, и если это действительно читаемый документ, Аудио Обзор будет сгенерирован.

-4

Вы можете загружать различные файлы, хотя не все из них могут подойти для создания Аудио Обзора. Поддерживаемые типы файлов включают:

• C, CPP, PY, JAVA, PHP и SQL файлы

• TXT, DOC, DOCX, PDF, RTF, DOT, DOTX, HWP и HWPX файлы

• PPTX, XLS и CSV файлы

• Google Docs и Google Slides

Если у вас есть подписка на Gemini Advanced, вы также можете загружать файлы HTML, XLSX, TSV и Google Sheets.

Как упоминалось ранее, вы можете загружать изображения в Gemini, но создание Аудио Обзора из файлов изображений невозможно. Тем не менее, если вы сохраните изображение в формате PDF, создать Аудио Обзор станет возможным, если изображение содержит читаемый текст.

Создать Аудио Обзор из отчета Deep Research также просто; после генерации отчета Deep Research должно появиться предложение создать Аудио Обзор для отчета. Однако я заметил, что это не всегда происходит. Если опция не появляется, вы можете просто попросить Gemini создать Аудио Обзор, и он обязательно сделает это для вас.

Насколько хороши Аудио Обзоры Gemini?

С тех пор как появились ИИ-чат-боты, многие их возможности кажутся настоящим волшебством. Меня по-прежнему удивляет, что всего за мгновение ИИ может создавать изображения вещей, которые раньше не существовали. Аудио Обзоры Gemini также способны вызывать подобные эмоции.

Результаты действительно впечатляют. Голоса звучат очень реалистично, создавая ощущение, что вы слушаете настоящих людей, беседующих друг с другом. Их взаимодействие тоже проработано: ведущие перебивают друг друга в подходящие моменты, что делает диалог более естественным.

-5

При тестировании функции результаты часто выделяют ключевые моменты документов и представляют их в доступной форме. Я загрузил руководство для старого фотоаппарата Canon EOS 3, и ведущие провели весьма информативное обсуждение функции автофокуса с отслеживанием глаз.

Я также загрузил неопубликованный сценарий, и ведущие обсудили основные моменты сюжета в увлекательной манере, отметив множество юмора и ключевых моментов. Однако результаты не всегда идеальны: резюме сценария не охватило ключевой момент сюжета, необходимый для понимания как названия сценария, так и его трогательной финальной строки.

Аудио Обзоры в основном являются отличным способом доступа к информации

Некоторые функции ИИ могут создавать впечатление, что компании просто демонстрируют свои возможности, а не предлагают действительно полезные инструменты. Однако функция Аудио Обзоров этим ощущением не страдает.

Чтение длинного документа не всегда представляет собой самый удобный способ извлечения ключевой информации. Прослушивание обсуждения информации двумя людьми может значительно упростить выделение основных фактов, не погружаясь в детали самостоятельно. Наличие двух собеседников — это разумное решение, поскольку часто один из ведущих задает те вопросы, которые вы бы хотели задать.

В частности, я нашел Аудио Обзоры очень полезными для отчетов Deep Research. Эти отчеты часто представляют собой длинные стенограммы текста, и хотя они полны полезной информации, читать целый отчет бывает утомительно. Аудио Обзор такого отчета воспринимается намного легче, и ИИ отлично справляется с извлечением важной информации, не отвлекаясь на менее значимые детали.

-6

Однако это не означает, что Аудио Обзоры идеальны. Я заметил, что часто сталкиваюсь с той же проблемой, что и при прослушивании аудиокниг: я отвлекаюсь и пропускаю кое-что из того, что говорится. Мне приходится возвращаться назад, чтобы не упустить важные моменты.

Конечно, это не вина Аудио Обзоров, и я уверен, что не я один испытываю такую проблему. Лично мне они лучше воспринимаются, когда я не отвлекаюсь, например, во время прогулки с наушниками, но ваши предпочтения могут отличаться.

Подкасты также не всегда содержат всю информацию, которую вы могли бы желать извлечь. Аудио Обзор сценария действительно охватил большую часть центральных сюжетных элементов, но при этом упустил некоторые темы, которые не были абсолютно центральными, но были ключевыми для развития сюжета.

Если вам не нравится погружаться в большие объемы текста, чтобы получить нужную информацию, Аудио Обзоры могут стать полезной альтернативой. Вы можете превратить почти всё в свой уникальный подкаст и позволить другим рассказать вам о важных моментах, вместо того чтобы читать их самим. Надеюсь, что Google добавит возможность создания Аудио Обзоров из контента веб-сайтов в будущем, потому что сейчас вам ещё необходимо преодолеть некоторые преграды для этого.

Если вам понравилась эта статья, подпишитесь, чтобы не пропустить еще много полезных статей!

Вы также можете читать наши материалы в: