От простых команд к диалогам: революция Google в голосовых помощниках
На этой неделе Google выпустил целый ряд новинок, включая смартфоны Pixel 9 и новые беспроводные наушники. В центре внимания оказался новый искусственный интеллект компании — помощник Gemini. Этот чат-бот, представленный ранее в этом году, теперь стал основным ассистентом на устройствах серии Pixel 9 и доступен на миллионах Android-смартфонов по всему миру. Но сейчас Google запускает новую функцию для общения с этим помощником — Gemini Live.
Gemini Live — это ответ Google на GPT-4 от OpenAI, позволяющий общаться с помощником так, как будто вы ведете диалог с другим человеком (по крайней мере, это их цель). На данный момент функция доступна на английском языке для подписчиков Gemini Advanced (за $20 в месяц). Чтобы начать пользоваться Gemini Live, достаточно нажать на кнопку Live в нижнем правом углу приложения Gemini. В ближайшие недели функция станет доступной на iOS и будет поддерживать больше языков.
Сисси Сяо, вице-президент по развитию Gemini в Google, отмечает, что этот чат-бот — не просто усовершенствованный Google Assistant. Это полностью переработанный интерфейс, основанный на генеративном искусственном интеллекте. «За годы работы над Assistant пользователи неоднократно просили нас о двух вещах: они хотят, чтобы ассистент был более естественным в общении и мог помогать решать жизненные задачи, а не только выполнять простые команды», — говорит Сяо.
Как работает Gemini Live
При запуске Gemini Live вы увидите чистый экран с мягким светом, исходящим снизу. Общение с помощником можно начинать даже при заблокированном экране телефона. Также Gemini Live доступен через новые наушники Pixel Buds Pro 2, что позволяет общаться с ним без использования рук, когда телефон находится, например, в сумке. Вы можете выбрать один из десяти голосов, отличающихся тоном, акцентом и стилем. В конце сеанса общения на экране появится расшифровка всего разговора, которая сохраняется в приложении Gemini.
Gemini Live позволяет прерывать разговор, не нарушая при этом его ход, что особенно полезно, так как ассистент склонен говорить очень много. В будущем планируется интеграция Gemini Live с другими приложениями через расширения, хотя многие из них пока недоступны. Например, вы сможете попросить Gemini Live найти приглашение на вечеринку в Gmail и узнать его время и место, вместо того чтобы искать это самостоятельно. Или же можно будет попросить добавить ингредиенты из рецепта в список покупок в Google Keep. Эти и другие расширения для таких приложений, как Keep, Tasks, Utilities, Calendar и YouTube Music, будут доступны в ближайшие недели.
Будущее функций Gemini Live
Позже в этом году Google планирует добавить в Gemini Live технологию компьютерного зрения Project Astra, которую компания представила на своей конференции для разработчиков в мае. Это позволит использовать камеру смартфона для анализа объектов в реальном времени. Например, вы сможете пройти мимо афиши концерта и попросить Gemini сохранить даты мероприятия в календаре и установить напоминание о покупке билетов.
Новый уровень взаимодействия с технологией
До сих пор использование голосовых помощников сводилось в основном к простым запросам. Общение с Gemini Live стало шагом вперед — теперь это не просто запрос погоды или управление домашними устройствами. Сяо отмечает, что она любит использовать Gemini Live в машине по пути домой, обсуждая темы вроде Олимпиады в Париже или выступления Селин Дион. Например, однажды она попросила рассказать о песне, которую исполнила певица, и в результате узнала, что Селин Дион умеет петь на китайском. Этот опыт иллюстрирует, как можно узнать что-то новое через диалог с технологией.
В рамках демонстрации возможностей Gemini Live я спросил, что мне поужинать. Помощник предложил несколько вариантов, и когда я упомянул, что у меня аллергия на креветки, он предложил блюдо с лососем. Когда я сказал, что лосося у меня нет, ассистент предложил приготовить курицу на гриле и добавить ее в салат. Я мог бы попросить рецепт, и Gemini начал бы пошагово объяснять его. Если бы я прервал разговор, я все равно мог бы вернуться к рецепту позже в приложении.
Будущее голосовых ассистентов
Gemini Live меняет сам подход к поиску информации. Вы задаете вопросы, получаете ответы и продолжаете беседу, чтобы узнать больше. Однако есть определенные трудности: ответы Gemini могут быть излишне длинными, что иногда мешает вовремя задать следующий вопрос. Кроме того, отсутствует прямая ссылка на источники информации, что вызывает сомнения в достоверности данных.
Тем не менее, Gemini Live — это, возможно, будущее поисковых систем. Вы просто спрашиваете, получаете ответ и продолжаете диалог для получения дополнительной информации. Однако ассистент все еще имеет ограничения, и в некоторых случаях Google Assistant остается более удобным. Например, новый Nest будет оснащен улучшенным голосом и возможностями, основанными на больших языковых моделях Gemini, что позволит выполнять задачи, такие как проверка записи с видеодомофона или более точное уведомление о движении.
Gemini или Google Assistant?
Сейчас у Google два ассистента: персональный Gemini и общий Google Assistant. Gemini будет отвечать за личные задачи, такие как управление календарем и электронной почтой, а Google Assistant останется семейным устройством, доступным всем в доме. Однако, использование двух разных помощников может создать путаницу у пользователей, особенно если они привыкают к функционалу одного устройства и сталкиваются с ограничениями на другом.
Так или иначе, Google стремится сделать своих ассистентов максимально полезными и удобными в повседневной жизни, и Gemini Live — важный шаг в этом направлении.
Агентство по подбору роботов
Агентство по подбору роботов - это набор услуг, направленных на оптимизацию и развитие бизнеса с помощью инструментов искусственного интеллекта. Продукт легко встраивается на веб-сайты, приложения и мессенджеры. Он не требует постоянного бюджета, помогает оптимизировать трудозатраты на рутинные задачи, обеспечивает постоянный контакт с клиентами и упрощает работу с документами.
Подробнее о продукте можно узнать на странице "Агентство по подбору роботов" по ссылке: Агентство по подбору роботов.
Полезные ссылки:
AI Lab in Telegram @itinai - бесплатная консультация Сервис по подбору AI-роботов для бизнеса