Найти в Дзене

SciArena: сравнение LLM для научных исследований

SciArena: сравнение LLM для научных исследований Появилась новая открытая платформа SciArena для оценки крупных языковых моделей (LLM) по задачам, связанным с научной литературой, на основе предпочтений людей. Первые результаты показывают, что между моделями есть заметные различия в качестве работы. Платформу разработали исследователи из Йельского университета, Нью-Йоркского университета и Allen Institute for AI. SciArena позволяет сравнить, как справляются с научными задачами закрытые и открытые… Подробнее

SciArena: сравнение LLM для научных исследований

Появилась новая открытая платформа SciArena для оценки крупных языковых моделей (LLM) по задачам, связанным с научной литературой, на основе предпочтений людей. Первые результаты показывают, что между моделями есть заметные различия в качестве работы.

Платформу разработали исследователи из Йельского университета, Нью-Йоркского университета и Allen Institute for AI. SciArena позволяет сравнить, как справляются с научными задачами закрытые и открытые…

Подробнее