Ученые из AIRI, НИУ ВШЭ и Constructor University представили бенчмарк GeomMotif для оценки способности ИИ-моделей работать с геометрией белковых структур. Он включает 57 задач и позволяет выявлять, на каком этапе модели допускают ошибки. Работа представлена на конференции ICLR в Рио-де-Жанейро. Задача бенчмарка — проверить способность модели достраивать белок вокруг заданного структурного фрагмента с сохранением его точной 3D-геометрии. Ранее отдельного инструмента для такой оценки не существовало. В GeomMotif фрагменты отбираются по геометрическим и физико-химическим свойствам, а не по функции, что критично, поскольку даже отклонение на один ангстрем может резко снизить вероятность успешного проектирования. Для создания бенчмарка использованы высококачественные структуры из Protein Data Bank, очищенные от дубликатов и проверенные на воспроизводимость. Это гарантирует, что задачи реалистичны и принципиально решаемы. Набор задач охватывает разные сценарии проектирования с учетом формы,
Разработан бенчмарк для выявления слабых мест ИИ-моделей для дизайна белковых молекул
ВчераВчера
2 мин