Учёные российского научно-исследовательского института искусственного интеллекта AIRI создали бенчмарк для проверки того, насколько большие языковые модели (LLM) справляются с реальными задачами химиков. Причём речь идёт не просто об извлечении фактов, а о последовательном решении связанных между собой вопросов и исследовательской проблематики. Для этих целей исследователи AIRI разработали новый бенчмарк, построенный из композиций базовых химических задач. В бенчмарк вошли такие параметры, как определение продуктов реакций, предсказание их свойств и генерация описаний молекул по формуле и другие. Примечательно, что каждая цепочка заданий для нейросети моделирует логику реальной повседневной работы химика. Для проверки эффективности LLM в потенциальном создании лекарств ИИ должен определить, какой конкретно продукт получится в результате реакции, а затем оценить, обладает ли предложенное вещество каким-либо ценным свойством, в частности биоактивностью. Таким образом, учёные ставят перед
Учёные проверили, насколько нейросети пригодны для создания новых лекарств
1 ноября 20251 ноя 2025
8
1 мин