31 подписчик

OpenScholar — первый в мире полностью открытый ИИ для научных обзоров, опубликованный в Nature

5 февраля5 фев

2 мин

4 февраля 2026 года в журнале Nature была опубликована статья о разработке OpenScholar — первого в мире полностью открытого и специально созданного для научных исследований языкового модели с усиленным поиском (Retrieval-Augmented Generation, RAG). Этот инструмент способен точно находить релевантные научные статьи, избегать «галлюцинаций» и генерировать высококачественные ответы с корректными ссылками на источники. Точность цитирования на уровне экспертов OpenScholar интегрирует базу из 45 миллионов открытых научных публикаций и использует уникальный механизм самоконтроля, что позволяет значительно повысить точность и достоверность генерируемых ответов. В отличие от GPT-4o, который при цитировании научных работ ошибается в 78–90% случаев, OpenScholar демонстрирует сопоставимую с человеческими экспертами точность. Три ключевых технологических инновации Новый стандарт оценки — ScholarQABench Для оценки OpenScholar был создан масштабный междисциплинарный тестовый набор ScholarQABench, вкл

Точность цитирования на уровне экспертов

OpenScholar интегрирует базу из 45 миллионов открытых научных публикаций и использует уникальный механизм самоконтроля, что позволяет значительно повысить точность и достоверность генерируемых ответов. В отличие от GPT-4o, который при цитировании научных работ ошибается в 78–90% случаев, OpenScholar демонстрирует сопоставимую с человеческими экспертами точность.

Три ключевых технологических инновации

OSDS — собственная база данных: включает 45 миллионов открытых научных статей и 236 миллионов векторных представлений абзацев, обеспечивая актуальность и полноту данных для поиска и генерации.
Адаптивный поиск: обученный поисковый механизм, который не просто ищет по ключевым словам, а понимает смысл запроса и находит наиболее релевантные фрагменты.
Механизм самоконтроля: после первичной генерации ответа модель проверяет его на фактическую точность, полноту и корректность ссылок, улучшая результат в несколько итераций.

Новый стандарт оценки — ScholarQABench

Для оценки OpenScholar был создан масштабный междисциплинарный тестовый набор ScholarQABench, включающий почти 3000 экспертных вопросов и более 200 длинных ответов из областей компьютерных наук, физики, нейронаук и биомедицины. В этом тесте OpenScholar-8B превзошел GPT-4o и специализированные системы, а по точности цитирования приблизился к уровню экспертов.

Превосходство в сравнении с экспертами

В слепом тестировании эксперты чаще выбирали ответы OpenScholar, чем ответы, написанные людьми. Модель с 8 миллиардами параметров и версия на базе GPT-4o показали победу над человеческими ответами в 51% и 70% случаев соответственно, тогда как оригинальный GPT-4o уступал экспертам.

Практичность и доступность

OpenScholar использует легковесный специализированный поисковый модуль, что снижает вычислительные затраты и делает систему более доступной для широкого применения в научных кругах.

Ограничения и перспективы

Несмотря на успехи, OpenScholar пока ограничен в охвате дисциплин (преимущественно естественные науки), и в некоторых сложных случаях не всегда находит самые актуальные публикации. Также существуют вызовы с интеграцией платных и защищённых авторским правом материалов.

Исследовательская команда уже открыла исходные коды, данные и модели OpenScholar, чтобы стимулировать дальнейшие разработки. В будущем планируется расширение поддержки новых научных областей, многоязычности и сотрудничество с издательствами для легального.

Хотите создать уникальный и успешный продукт? СМС – ваш надежный партнер в мире инноваций! Закажи разработки ИИ-решений, LLM-чат-ботов, моделей генерации изображений и автоматизации бизнес-процессов у профессионалов.

ИИ сегодня — ваше конкурентное преимущество завтра!

Тел. +7 (985) 982-70-55

E-mail sms_systems@inbox.ru

Сайт https://www.smssystems.ru/razrabotka-ai/