96 подписчиков
Ну что ж, большая гонка ИИ в смартфонах только что началась. На конференции Google IO компания рассказала о своем видении искусственного интеллекта на уровне операционной системы Android 15. Нам это интересно не только с точки зрения спортивного интереса, но и как пример попытки вкрутить ИИ в повседневную жизнь пользователей. Apple, по сущности, через месяц придется решать такую же задачу.
По словам представителей Google, Android была разработана с учетом особенностей искусственного интеллекта, и языковая модель Gemini является "основополагающей частью опыта Android", работающей на системном уровне. В нем есть поисковая строка с поддержкой ИИ, которая может использоваться для ответов на запросы и поиска информации, а функция «Circle to Search» может использоваться для решения задач по математике и физике или получения помощи в выполнении домашнего задания.
Gemini выступает в качестве ИИ-ассистента на Android вместо Google Assistant, и ИИ Gemini можно будет вызывать в виде наложения на любое используемое приложение. Gemini ориентируется на контекст и может предугадывать действия пользователя смартфона, предоставляя контекст в данный момент. Он может создавать изображения для текстов и социальных сетей или отвечать на вопросы о просматриваемом видео, анализировать PDF-файлы, веб-сайты и другой контент, составлять резюме и переводить.
Для некоторых функций Google крутит искусственный интеллект прямо на устройстве, что, по слухам, будет делать и Apple. Gemini Nano, ИИ Google на устройстве, в настоящее время выполняет такие функции, как генерация умных ответов в приложениях для обмена сообщениями и резюмирование голосовых заметок. Gemini Nano с поддержкой мультимодальности появится на телефонах Pixel в конце этого года и позволит реализовать новые функции искусственного интеллекта на устройстве, такие как TalkBack, которая поможет слепым и слабовидящим пользователям лучше воспринимать окружающий мир. Google также разрабатывает функцию проверки звонков, которая будет активно прослушивать звонки и сообщать пользователям, если они похожи на мошенничество.
Сегодня Google также анонсировала Gemini 1.5 Flash — облегченную версию модели искусственного интеллекта Gemini Pro. Gemini Flash более эффективна, менее затратна и имеет меньшую задержку. Google утверждает, что Gemini 1.5 Flash способен обеспечить «впечатляющее качество» для своего размера, отлично справляясь с резюмированием, приложениями для чатов, созданием подписей к изображениям и видео, а также извлечением данных из длинных документов.
Gemini 1.5 Pro также был улучшен и способен выполнять все более сложные и тонкие инструкции, включая разбор документов объемом до 1500 страниц или час видеоконтента. С Gemini можно взаимодействовать в Google Сообщениях, а подписчики Gemini Advanced смогут оценить новый мобильный разговорный опыт, который делает общение с Gemini более интуитивным. Подписчикам также доступны индивидуальные версии Gemini под названием Gems - персонализированные помощники, которые могут помогать с тренировками, предлагать рецепты и многое другое, обладая при этом особым характером.
Проект Astra, еще одно начинание Google, направлен на создание ИИ-агентов, которые могут быть полезны в повседневной жизни. Google продемонстрировала прототип агента, способного идентифицировать объекты, предоставлять контекст информации с камеры и вспоминать хронологию событий для поиска потерянной вещи.
И как вам? Это ли не хватало в жизни?
2 минуты
15 мая 2024