Найти в Дзене
Нейросети с Финком

Аналог Chatbot: SciArena

Оглавление

Институт искусственного интеллекта Пола Аллена запустил SciArena — инновационную платформу для соревнования ИИ-моделей в решении научных задач. Это аналог популярной Chatbot Arena, но с акцентом на точность, аргументированность и научную достоверность. Теперь каждый желающий — от студента до исследователя — может бесплатно получить два независимых ответа с ссылками на научные источники и оценить, какой ИИ справился лучше.

Всем привет! Меня зовут Константин Финк, я предприниматель с опытом более 15 лет (производственный бизнес). Последние 3 года активно занимаюсь внедрением ИИ в бизнес процессы компании. Сейчас основное направление это аутстаф ИТ специалистов. Если у вас есть задачи по ИТ, обращайтесь

Как работает SciArena?

Оценка моделей на платформе устроена максимально объективно:

  • Используется система AI2 ScholarQA, которая ищет статьи по запросу в базе Semantic Scholar — крупнейшем научном хранилище.
  • Затем два случайно выбранных ИИ получают одинаковый набор данных: исходный вопрос и список релевантных статей.
  • Модели должны составить развёрнутый ответ, подтверждая каждое утверждение ссылкой на конкретную научную публикацию.
  • Ответы стандартизируются — убираются логотипы и особенности оформления, чтобы исключить влияние бренда.
  • После этого пользователь читает оба ответа и голосует за тот, который считает более точным и полезным.

Кто лидирует?

На момент запуска в SciArena участвуют 23 модели от ведущих компаний — OpenAI, Google, Anthropic, Alibaba и других. Чтобы создать первичный рейтинг, команда проекта провела более 13 тысяч состязаний с участием 102 научных экспертов.

По результатам тестов лидирует OpenAI o3 — эта модель стабильно показывает лучшие результаты во всех научных направлениях: от физики и инженерии до биомедицины. В тройке лидеров также Claude 4 Opus (Anthropic) и Gemini 2.5 Pro (Google).

Как попробовать?

SciArena уже доступна всем желающим. Вопрос можно задать на русском языке, однако стоит учитывать, что некоторые модели пока отвечают только по-английски.

📌 Платформа отлично подойдёт для:

  • Студентов и аспирантов
  • Научных журналистов
  • Преподавателей
  • Всех, кто работает с научной информацией

👉 Попробовать SciArena можно по ссылке.

ПОЛЕЗНЫЕ ССЫЛКИ: