Американский миллиардер Илон Маск утром провёл совместный стрим с сотрудниками подконтрольной ему компании xAI. Последняя сосредоточена на разработке генеративного искусственного интеллекта, а её флагманский продукт – умный чат-бот Grok. Темой презентации стало третье поколение системы. Grok 3.0 приносит с собой большой прирост характеристик в различных бенчмарках. Например, за полгода, что прошли с момента выхода версии 2.0, результаты в популярном тесте GPQA выросли с 56 до 85%. GPQA, напомним, проверяет логику и научные знания. Не менее впечатляющим результатом стал рекорд новинки в сервисе для тестирования чат-ботов – Chatbot Arena от LMSYS. Тестовая версия Grok 3 оказалась там первой системой, которая набрала более 1400 баллов по системе ELO. Ещё ни одному чат-боту не удавалось демонстрировать столь высокие показатели. Позади остались предыдущие лидеры, включая Gemini 2.0 от Google, актуальную версию GPT-4o от OpenAI и DeepSeek R1. Напомним, рейтинг Chatbot Arena выстраивается на
Илон Маск запустил третье поколение умного чат-бота Grok
18 февраля 202518 фев 2025
14
3 мин