В Калифорнии прошла презентация Made By Google 2024. Главным фокусом компании в этом году ожидаемо стал AI и его применение в области голосового общения, создания изображений и умного дома.
Привет, OpenAI!
Gemini Live — новая функция для голосового общения от Google. Ассистент может взаимодействовать с различными приложениями Google, такими как Gmail, YouTube Music, Google Maps, что позволяет выполнять сложные задачи, например, находить рецепты, составлять плейлисты и маршруты. Это ответ компании на голосовой режим от OpenAI, который сейчас проходит ограниченное альфа-тестирование. Доступна Gemini Live подписчикам Google One AI Premium (≈$20).
Что умеет Gemini Live
⚫️ Отвечает менее чем за две секунды.
⚫️ Быстро реагирует, если ее перебивают, умеет менять тему разговора.
⚫️ Запоминает несколько часов разговора.
⚫️ 10 голосов на выбор для общения. Над созданием каждого голоса Google работала с актерами озвучивания. В компании уверяют, что проблем с авторскими правами не возникнет.
Наконец-то, можно делать общие фото на вечеринках
Функция Add Me позволяет фотографу стать частью группового снимка, используя AI и дополненную реальность. Пользователю нужно сделать два снимка: один без него, а на другом — поменяться с кем-то местами. Смартфон совместит два снимка, и на итоговом изображении будут все участники, включая фотографа.
Pixel Studio — еще одна опция от Google, которая появится на новой линейке смартфонов Pixel 9. Приложение позволит генерировать изображения по текстовому промпту. Однако, из-за скандалов, возникших в начале года из-за «слишком толерантных снимков», человеческие лица пока запрещены к генерации.
Дом с человеческим... голосом
Внедрили Gemini и в устройства для умного дома. Умные термостаты Nest и прочие домашние гаджеты из этой линейки теперь будут коммуницировать с пользователем более органично и менее роботизированно.
Самый популярный Telegram-бот с доступом к нейросетям — @GPT4Telegrambot.