Учёные Северо-западного медицинского института (Northwestern Medicine) создали алгоритм на основе глубокого обучения, позволяющий обнаруживать участки генома, в которых происходит полиаденилирование. Исследователи утверждают, что эта разработка необходима для изучения заболеваний, которые возникают при нарушении процесса транскрипции ДНК. Выводы работы опубликованы в журнале Nature Communications.
Полиаденилирование – важный этап экспрессии генов, во время которого нуклеотиды присоединяются к РНК, благодаря чему происходит стабилизация и подготовка к трансляции. Также полиаденилирование является сигналом к терминации – остановке процесса транскрипции, что предотвращает ошибочную экспрессию генов.
На сегодняшний день данных о локализации сайтов полиаденилирования в геноме и факторах, которые влияют на их активность, недостаточно, однако известно, что этот процесс связан с развитием онкологических заболеваний, неонатального сахарного диабета и некоторых генетических заболеваний.
«Наше исследование сосредоточено на изучении механизмов контроля полиаденилирования и терминации транскрипции, которая, как правило, начинается с удаления кэпа полиаденинового хвоста на 3'-конце РНК. Мы задались вопросом: где в геноме локализованы сайты полиаденилирования и как они активируются?», – говорит ведущий автор работы Чжэ Жи (Zhe Ji), Ph.D., доцент кафедры фармакологии Института инженерии и прикладных наук Маккормика (McCormick School of Engineering), научный сотрудник Комплексного онкологического центра Роберта Х. Лурье Северо-Западного университета (Robert H. Lurie Comprehensive Cancer Center of Northwestern University).
Разработкой алгоритма на основе глубокого обучения для анализа местоположения в геноме сайтов полиаденилирования и их активности занималась Эмили Строуп (Emily Stroup), Ph.D., аспирант Driskill Graduate Program.
«Предложенный алгоритм основан на самообучении, это позволяет точно вычислять, где находятся сайты полиаденилирования, а также определять факторы, влияющие на регуляцию этого процесса», – объясняет Строуп.
Применив алгоритм, исследователи обнаружили, что на сайты полиаденилирования влияют различные сигналы, экспрессируемые рядом с ними. Также учёные идентифицировали последовательности генома, в которых полиаденилирование происходит наиболее эффективно, – это может стать основой будущих научных работ.
«Нам удалось впервые точно установить расположение сайтов полиаденилирования и описать геномные факторы, которые контролируют их функционирование. Теперь мы можем модулировать этот процесс для дальнейшего исследования», – говорит Строуп.
«Изучив, как происходит полиаденилирование в определённых участках генома, учёные смогут разработать новые терапевтические тактики для коррекции этого процесса при ряде заболеваний. Нам удалось совершить прорыв с помощью нового алгоритма, учитывающего множество сигналов: стало возможным прогнозировать расположение сайтов полиаденилирования с точностью в один нуклеотид», – комментирует Чжэ Жи.
Далее учёные планируют разработать аналогичные алгоритмы для геномов других видов, включая рыбок данио, плодовых мушек и дрожжей, чтобы сравнить расположение и функциональные особенности сайтов полиаденилирования.
«Предварительные результаты уже получены, мы обнаружили множество различий в сигналах у разных видов, что является свидетельством эволюционных особенностей. Мы хотим выяснить, как сайты полиаденилирования связаны с различными заболеваниями, такими как мышечная дистрофия, неврологические расстройства и онкологические процессы», – говорит Чжэ Жи.
Источник: medicalxpress.com