108 подписчиков
Google дал ответ OpenAI, представив голосового ИИ-помощника
Gemini Live – это новая функция от Google, которая позволяет вести голосовые разговоры с искусственным интеллектом
По сути, это ответ Google на подобную функцию, недавно представленную в ChatGPT
Это значит, что теперь можно вести свободный разговор с ИИ, как с обычным человеком
ИИ будет использовать 10 разных голосов, чтобы сделать разговор более естественным
Самое главное, что он сможет понимать, чего ты хочешь, даже если ты не будешь говорить четко и полностью, и подстраиваться под твой стиль разговора
Что умеет Gemini Live:
• естественные диалоги:
Благодаря голосовому движку, разговоры с Gemini Live становятся более похожими на общение с реальным человеком
ИИ может поддерживать длительные беседы, выражать эмоции и адаптироваться под ваш стиль общения
• можно перебивать ИИ в любой момент, чтобы задать уточняющие вопросы или изменить тему разговора
На данный момент функция доступна для владельцев телефонов Pixel 8
Это связано с тем, что в этих устройствах уже интегрированы необходимые для работы Gemini Live технологии
Gemini Live открывает новые горизонты для использования искусственного интеллекта в повседневной жизни
Например, вы можете использовать его для обучения языкам, получения рекомендаций или просто для компании
А компания Маска xAI представила Grok-2 в бэта версии, и она показывает большие результаты в таких сферах, как общение, программирование и логическое мышление
Ключевые особенности Grok-2:
• высокая производительность:
Grok-2 превосходит своих конкурентов, таких как Claude 3.5 и GPT-4, в различных бенчмарках
• модель демонстрирует глубокое понимание текста, включая способность работать с визуальной информацией
Какие практические задачи может решить модель:
• поиск по изображениям, видео
• разработка чат-ботов
Чат-боты на основе Grok-2 смогут вести более сложные и осмысленные диалоги, лучше понимая контекст разговора
• Чат-боты смогут использоваться для решения более широкого круга задач, например, для оказания технической поддержки, обучения или даже психологической помощи
Создание персонализированного контента:
• енерации текстов
• герсонализация рекомендаций
• разработка инструментов для программирования
• генерация кода
Grok-2 сможет генерировать фрагменты кода на основе естественноязыковых описаний
• персонализированное обучение: Модель может адаптировать учебный материал под индивидуальные особенности каждого ученика
• итерактивные учебные пособия
• научные исследования
• анализ больших объемов данных
• генерация гипотез
• перевод
Grok-2 доступен пользователям X (Twitter) с подпиской Premium или Premium+
В ближайшее время модель станет доступна разработчикам через API
xAI планирует добавить в модель новые функции: мультимодальное понимание и улучшенную поисковую систему
2 минуты
15 августа 2024