Голосовой помощник в телефоне долго оставался чем-то вроде вежливого секретаря, который умеет ответить на вопрос, но не способен довести дело до конца. Google решил эту логику переломить. На майской презентации The Android Show в редакции I/O компания показала, во что превращается следующая версия мобильной системы. Главная мысль звучала почти буднично, хотя меняет довольно много: Gemini перестаёт быть отдельным приложением или плавающим окошком поверх экрана и переселяется внутрь самой операционки, ближе к системным настройкам и повседневным действиям пользователя.
Gemini переезжает с поверхности экрана в фундамент операционной системы
Ключевое название, вокруг которого построена вся презентация, звучит как Gemini Intelligence. Это не косметический ребрендинг и не очередная иконка в меню. Разработчики прямо описывают это как слой интеллекта, работающий под капотом Android. Подход напоминает смену несущей конструкции, а не перекраску фасада.
Практический смысл раскрывается в многошаговых сценариях. Раньше, чтобы заказать поездку домой, человек открывал приложение, выбирал сохранённый адрес, проверял маршрут и подтверждал заказ. В новой схеме достаточно сформулировать просьбу голосом. Помощник сам откроет нужный сервис, подставит сохранённый адрес и подтвердит поездку, минуя ручное перелистывание экранов. Система обучена на популярных приложениях доставки еды и вызова такси, поэтому именно эти категории должны работать увереннее всего. Но возможности шире. Можно сфотографировать туристический буклет и попросить найти похожий тур на шестерых через сервис бронирования, после чего помощник уходит работать в фоне и присылает живые обновления о ходе задачи. Или продиктовать список покупок и получить готовую к оформлению корзину в любимом приложении магазина.
Запускается всё это удержанием кнопки питания и устной командой. Любопытная деталь, которая отличает подход Google от конкурентов: задача выполняется в фоне с пошаговыми отчётами, тогда как помощник Apple тяготеет к коротким операциям внутри одного приложения, избегая длинных автоматических цепочек. Часть этой функциональности, связанная с автоматизацией задач, уже начала появляться на свежих флагманах ещё весной.
Rambler превращает сбивчивую устную речь в чистый текст без мусора
Отдельный подарок достался тем, кто любит переписку, но терпеть не может набирать текст пальцами. Голосовой ввод клавиатуры Gboard получает функцию под названием Rambler. Обычная диктовка переносит в текст ровно то, что услышала, со всеми запинками. Здесь подключается интеллект, который учитывает самопоправки, повторы, паузы и слова-паразиты вроде "э-э", "ну", "как бы" и распознаёт суть сказанного.
Лучше всего идею иллюстрирует живой пример. Человек диктует список покупок: яблоки, бананы, апельсины. Потом передумывает и говорит, что яблоки больше не нужны. Итоговый текст просто исключит первый пункт, словно его и не было. Грамматика правится на лету, тон сообщения при этом сохраняется. Поверх клавиатуры рисуется волновая дорожка во всю ширину, наглядно показывающая, что система слушает и думает. Отдельно стоит отметить мультиязычность: можно переключаться между языками прямо посреди фразы, например смешивать английский и хинди, и система разберёт смешанную речь без потери контекста. Запись идёт только в реальном времени, аудио не сохраняется.
Создание виджетов по текстовому описанию и обновлённый набор эмодзи
Третья крупная составляющая Gemini Intelligence это генеративные интерфейсы, и начинается всё с виджетов на домашнем экране телефона и плиток на смарт-часах. По сути пользователю предлагают собрать собственный виджет, просто описав словами, что он хочет. Нужен блок с планом питания на неделю или очень конкретный местный прогноз погоды, достаточно объяснить это текстом. Получаются не самые вычурные элементы, выдержанные в фирменном выразительном стиле оформления, зато функциональные и глубоко личные. На часах можно так же собрать циферблат, отслеживающий скорость ветра и осадки.
Помимо крупных функций, Android 17 приносит набор визуальных правок и инструментов для тех, кто создаёт контент. Эмодзи переходят на новую трёхмерную коллекцию. Появляется фокус на пользователей, которые часто выкладывают видео в популярных сервисах публикации контента. По итогам отраслевого партнёрства завезли захват и воспроизведение в расширенном динамическом диапазоне, встроенную стабилизацию видео и ночную съёмку, а конвейер от камеры до публикации перестроили так, чтобы по дороге не терялась резкость. Отдельная функция Screen Reactions позволяет записывать реакцию на контент с фронтальной камеры, используя экран как фон. Появляется и App Bubbles, возможность свернуть любое приложение в плавающий пузырь поверх остальных, по аналогии со знакомыми многим чат-головами мессенджеров.
Безопасность подтянули там, где обычно атакуют злоумышленники
Google давно утверждает, что Android блокирует больше мошеннических попыток, чем смартфоны конкурента, и на презентации эту линию усилили. Обновлённое обнаружение угроз в реальном времени непрерывно следит за приложениями, проверяя, не злоупотребляют ли они разрешениями: не пересылают ли скрытно сообщения, не используют ли служебные накладки поверх экрана не по назначению, не лезут ли в чувствительные данные в фоне.
Заметно укрепили защиту от кражи устройства. Функция отметки телефона как потерянного в сервисе поиска теперь требует не только PIN-кода или пароля, но и биометрического подтверждения. Даже если посторонний каким-то образом узнал пароль, разблокировать аппарат без отпечатка или лица у него не выйдет. Появилась и проверка звонков от финансовых организаций в связке с банками, способная отсечь подделку номера ещё до того, как вызов дойдёт до владельца. Дополнительный штрих для тех, кто переходит с другой платформы: система умеет переносить не только контакты, но и раскладку домашнего экрана вместе с виртуальной SIM.
Главная оговорка спрятана в требованиях к железу
Здесь история приобретает менее радужный оттенок, и об этом честно стоит сказать. Первая волна функций Gemini Intelligence достаётся только свежим устройствам Samsung Galaxy и Google Pixel этим летом, остальные подтянутся позже в течение года. Часы, автомобили, очки и ноутбуки получат всё это ещё позднее.
Проблема глубже простого графика выката. По имеющимся данным, аппаратная планка установлена жёстко: требуется около 12 гигабайт оперативной памяти и новая архитектура локальной модели. Это означает, что за бортом первой волны остаётся внушительная часть даже недавних топовых аппаратов. Новая модель пока зарезервирована почти исключительно за устройствами, выходящими в конце года. Аппараты на предыдущей версии локальной модели в список совместимых не попадают, и пока неясно, удастся ли когда-нибудь подтянуть их обновлением прошивки. Получается любопытный парадокс: платформу, которая обещает сделать смартфон по-настоящему умным, на старте смогут попробовать далеко не все владельцы умных смартфонов.
Если отступить на шаг и посмотреть на картину целиком, вырисовывается понятная стратегия. Google перестаёт относиться к искусственному интеллекту как к надстройке и встраивает его в саму ткань системы, попутно показывая то, что конкуренты пока только обещали. Презентация была лишь прологом перед большой конференцией для разработчиков, так что финальный набор возможностей и дата стабильного релиза ещё могут уточниться. Но направление задано вполне отчётливо. Телефон постепенно превращается из устройства, которым управляют, в устройство, которое многое берёт на себя. Вопрос, который остаётся открытым, скорее не технический, а человеческий: насколько комфортно окажется доверять рутину системе, которая всё чаще действует за пользователя, а не по его прямому касанию экрана. Ответ на него каждый, похоже, будет искать сам, по мере того как новые функции доберутся до его конкретного аппарата.