Добавить в корзинуПозвонить
Найти в Дзене

Методы извлечения биосинтетических генных кластеров из данных микробиома и перспективы их применения

Аннотация Биосинтетический генный кластер (BGC) представляет собой важный тип генетических наборов (gene set), который широко распространён в геномах различных организмов и играет важную метаболическую и регуляторную роль. С точки зрения линейной структуры генов гены в составе BGC обычно расположены в геноме в непосредственной близости друг от друга; что касается функций, гены в BGC обычно действуют синергически и отвечают за определённый класс метаболических путей, ведущих к образованию специфических низкомолекулярных соединений. Таким образом, BGC имеют жизненно важное значение в исследованиях по синтетической биологии как весьма перспективный источник функциональных элементов. Однако современные базы данных BGC и аналитические платформы ограничены числом и типами экспериментально валидированных BGC, а также используемыми в настоящее время методами первичного анализа BGC. Создание систематического подхода к открытию BGC на основе данных, их валидация, а также трансляционные исследова

Аннотация

Биосинтетический генный кластер (BGC) представляет собой важный тип генетических наборов (gene set), который широко распространён в геномах различных организмов и играет важную метаболическую и регуляторную роль. С точки зрения линейной структуры генов гены в составе BGC обычно расположены в геноме в непосредственной близости друг от друга; что касается функций, гены в BGC обычно действуют синергически и отвечают за определённый класс метаболических путей, ведущих к образованию специфических низкомолекулярных соединений. Таким образом, BGC имеют жизненно важное значение в исследованиях по синтетической биологии как весьма перспективный источник функциональных элементов. Однако современные базы данных BGC и аналитические платформы ограничены числом и типами экспериментально валидированных BGC, а также используемыми в настоящее время методами первичного анализа BGC. Создание систематического подхода к открытию BGC на основе данных, их валидация, а также трансляционные исследования представляют большую ценность как для фундаментальной науки, так и для практических приложений. Данная статья посвящена извлечению BGC из больших данных, связанных с микробиомом, для целей синтетической биологии. Мы начинаем с обсуждения определения и значимости извлечения BGC, затем суммируем современные ресурсы данных и методы извлечения BGC, включая MIBiG, antiSMASH и IMG-ABC — веб-сервисы, использующие искусственный интеллект (ИИ) для ускорения извлечения BGC. Далее мы приводим пошаговое описание того, как может проводиться типичное извлечение данных BGC, с особым акцентом на историю методов извлечения BGC, что подчёркивает путь развития от традиционного машинного обучения до глубокого обучения. Мы также анализируем узкие места в извлечении BGC и предлагаем возможные пути их решения. Кроме того, на основе нескольких экспериментальных работ по извлечению и валидации BGC мы демонстрируем глубокое разнообразие и широту сценариев применения при открытии BGC, а также важность комбинирования «сухих» (компьютерных) и «мокрых» (экспериментальных) лабораторных исследований для валидации вновь обнаруженных BGC. Наконец, мы предполагаем, что сочетание передовых методов извлечения BGC и синтетической биологии может расширить и углубить текущие исследования в области синтетической биологии.

-2

-3

-4

-5

-6

-7

-8

-9

-10

-11

-12

-13

-14

-15

-16

-17

-18

-19

-20

-21

-22

-23

-24

-25

-26

-27

-28

-29

-30