В прошлый вторник Google анонсировала новый продукт искусственного интеллекта в Gemini Live. Подобно недавно анонсированному GPT-4o от OpenAI, Gemini Live — это собственная мультимодальная модель искусственного интеллекта с впечатляющими возможностями голосовой и видеосвязи.
Gemini Live — это лишь одна часть «Проекта Астра» , универсального агента искусственного интеллекта, который потенциально может появиться в умных очках . На данный момент Gemini Live станет первой его версией на смартфонах.
Однако Gemini Live сегодня недоступен. Итак, какие функции будут доступны и когда мы сможем увидеть Gemini Live на устройствах Android?
Анонс и общая информация
- Google анонсировала новый продукт искусственного интеллекта, Gemini Live, в рамках «Проекта Астра».
- Gemini Live — мультимодальная модель ИИ с возможностями голосовой и видеосвязи.
- Первая версия Gemini Live будет доступна на смартфонах.
Текущие возможности и тестирование
- Во время демонстраций на Google I/O 2024 были проведены тесты речевых и видеоразговоров.
- В настоящее время Gemini Live недоступен для пользователей.
Как и в случае с GPT-4o, пользователи могут говорить в своем темпе и прерывать Gemini, чтобы добавить новую информацию или уточнить подсказки. В большинстве демонстраций и видеороликов, представленных на Google I/O 2024, присутствовал один женский и один мужской голос. Предполагается, что на выбор будет доступно 10 разных голосов.
Функции и улучшения версии 1.5
- Google сделала доступным Gemini 1.5 для платных пользователей Gemini Advanced.
- Gemini 1.5 включает расширенное контекстное окно для анализа больших документов и суммирования большого количества электронных писем.
- Улучшения в понимании изображений, визуализациях и диаграммах, использующих модели Imagen 3 и Google Veo.
- Возможность загружать Google Docs, PDF-файлы и другие документы для получения сводок и ответов.
Gemini Live получит функцию в стиле Google Lens, которая позволит пользователям использовать камеру на своем телефоне. Это позволит Gemini Live «видеть» мир через камеру и предоставлять обратную связь и ответы, что является предшественником потенциальных умных очков Project Astra, которые Google внедрил в свое живое демонстрационное видео.
Доступность и стоимость
- Gemini Live будет доступен в приложении Gemini на Android и iOS через голосовой значок.
- Доступна функция двустороннего разговора с выбором из 10 различных голосов.
- Подписка на Gemini Advanced стоит 19,99 долларов в месяц, с бесплатным двухмесячным пробным периодом.
Будущие обновления и планы
- Ожидается, что Gemini Live станет доступен «в ближайшие месяцы» или «этим летом», возможно, к концу июля.
- Функция использования камеры телефона, похожая на Google Lens, будет добавлена позже в этом году.
- Пока нет точных данных о доступности Gemini Live для всех пользователей.
Gemini Live — перспективный продукт ИИ от Google, который обещает улучшить взаимодействие с устройствами через голосовые и визуальные функции. Ожидается постепенное введение новых функций и расширение доступности в ближайшие месяцы.
______________________
Дзен: dzen.ru/unsero
Телеграм: t.me/unsero365
Вконтакте: vk.com/unsero
Одноклассники: https://ok.ru/unsero
#GeminiLive #ИскусственныйИнтеллект #Google #Технологии #ИИ #Будущее #ГолосоваяСвязь #Видеосвязь #ПроектАстра #НовыеТехнологии
#GeminiLive #ArtificialIntelligence #Google #Technology #AI #Future #VoiceCommunication #VideoCommunication #ProjectAstra #NewTech
______________________
Оформи дебетовую карту ВТБ по моей ссылке и получи 1 000 рублей. Карта для жизни с кешбэком до 50% рублями и бесплатным обслуживанием. Чтобы получить вознаграждение, соверши покупки на сумму от 5 000 рублей в течение месяца после оформления заявки. Перейти в ВТБ: https://vtb.ru/ref/YPwwOkB