Исследователи из Национального института стандартов и технологий США разработали статистический инструмент, который можно использовать для прогнозирования функций белков. Новый инструмент получил имя LANTERN («ФОНАРЬ»). Он может оказаться полезным в самых разных областях — от производства биотоплива до улучшения урожайности сельскохозяйственных культур и разработки новых методов лечения болезней.
Белки как строительные блоки жизни — ключевые элементы во всех этих задачах. Сейчас, когда ученые научились сравнительно легко вносить изменения в цепочки ДНК, которые служат основой при создании белков, остается сложной задачей определить, какие конкретные пары оснований нужно заменить для искомого эффекта. Для поиска этих ключевых пар используется модель ИИ, построенная на основе глубоких нейронных сетей, которые, хотя и эффективны, непрозрачны для человеческого понимания.
Напротив, «ФОНАРЬ» разработан так, чтобы быть понятным. Часть его объяснимости связана с использованием интерпретируемых параметров для представления анализируемых данных. Вместо того, чтобы позволять числу этих параметров становиться необычайно большим и вследствие непостижимым (как в случае с DNN), каждый параметр в расчетах «ФОНАРЯ» имеет цель, которая должна быть интуитивно понятной. Он не только будет помогать в сложной практической работе по модификации белков, но и делать это «прозрачно», полностью интерпретируемо.
В ходе тестирования «ФОНАРЬ» показал способность предсказывать генетические изменения, необходимые для создания полезных различий в трех разных белках. Один из них — спайковый белок SARS-CoV-2. Понимание того, как изменения в ДНК могут повлиять на этот белок-шип, может помочь эпидемиологам предсказать будущее пандемии COVID-19. Два других — хорошо известные лабораторные «рабочие лошадки»: белок LacI бактерии E. coli и зеленый флуоресцентный белок (GFP), используемый как маркер в биологических экспериментах.