Google вместе с серией Pixel 9 представила Gemini Live — голосовой интерфейс для ведения бесед с виртуальным помощником. С его помощью нейросеть «корпорации добра» может, подобно ChatGPT, общаться с пользователем в реальном времени.
Многословно, но удобно
Gemini Live позволяет намного быстрее и проще найти ответ на вопрос, чем обычный поиск в Google, пишет замредактора The Verge Алекс Кранц. Но у ассистента есть одна особенность: он умеет болтать без остановки, если его не прервать.
Это было похоже на разговор с моим 9-летним крестником. Как и он, Gemini Live не умеет читать сигналы на моем лице, поэтому не может распознать, что на самом деле меня не так волнует обсуждаемая тема, как его.
Алекс Кранц замредактора The Verge
С другой стороны, Gemini Live звучит настолько человечно, что его не очень удобно перебивать. В итоге Кранц обнаружила, что чаще увлекается короткими взаимодействиями с ассистентом, чем использует его в качестве партнёра по генерации идей. О том, что Gemini Live многословен, говорит и Джулиан Чоккатту из Wired.
В отличие от Advanced Voice Mode для ChatGPT, Gemini Live не способен сопровождать речь междометиями («хм», «ммм» и так далее) или переходить на шёпот. Хотя пользователь может выбрать из нескольких голосов, в целом речь помощника звучит апатично и отстранённо, считает Кайл Виггерс из TechCrunch.
Gemini Live всё так же склонен к галлюцинациям и выдаче неактуальной информации, как любая другая LLM. Например, на просьбу посоветовать недорогие бары в Нью-Йорке ассистент предложил заведение, прекратившее работать в 2019 году, затем назвал другой бар, который вообще никогда не существовал.
Ещё один недостаток Gemini Live — отсутствие связи с внешними сервисами. В отличие от текстового режима Gemini, в голосовом формате помощник не может включить песню в YouTube Music или суммаризировать входящие письма из ящика на Gmail. Зато Gemini Live не составляет труда вспомнить контекст вчерашних обсуждений.
Вдобавок сбивает с толку существование Google Assistant. Пока компания не планирует отключать старого помощника. В настройках Gemini сохраняется возможность переключиться на «Ассистента». Актуальная стратегия «корпорации добра» выглядит так: Gemini — личный помощник; Google Assistant — публичный помощник, к которому могут обращаться все домашние и гости. «Люди не хотят, чтобы их имейлы были доступны на умной колонке в гостиной, к содержимому которой легко получить доступ гостям», — рассказал представитель техногиганта.
Как включить Gemini Live
Google постепенно распространяет новый режим среди пользователей Android-смартфонов с подпиской Gemini Advanced, доступной за 19,99 доллара в месяц. Покупатели Pixel 9 Pro и Pro Fold получат Gemini Advanced на 12 месяцев бесплатно.
Gemini Live пока функционирует только на английском, хотя в ближайшие недели разработчики планируют добавить поддержку других языков. Вскоре внедрят и совместимость с iOS.
Если устройство получило Gemini Live, в последней версии приложения для помощника появится специальная кнопка внизу. При её нажатии откроется полноэкранный голосовой интерфейс с возможностью переключаться между доступными голосами (всего их 10). Здесь же есть кнопки для прекращения или приостановки диалога.