Найти в Дзене
Биология и генетика

Размышления о геноме. Часть 1

Вычислительная биология раскрывает скрытые закономерности эволюции и заболеваний в нашей ДНК Почти два десятилетия назад в рамках проекта "Геном человека" была составлена первая полная карта наших генов, в которой были обещаны новые грандиозные открытия о заболеваниях и их лечении. Правда информации было так много, что структурировать её надлежащим образом удалось еще не скоро. Сейчас биологи при помощи компьютеров, обладающих необходимой вычислительной мощностью, используют достижения в области машинного обучения и добычи данных, чтобы начать делать то, что не мог сделать человеческий разум в одиночку. Они проводят сравнения между индивидуумами и видами, ищут осмысленные закономерности. Они определяют какие части генома при мутации с наибольшей вероятностью могут вызвать заболевание. А некоторые начали применять новые аналитические инструменты для спасения жизней. "Мы начинаем видеть применение подходов машинного обучения в интерпретации генетических вариаций у человеческих пациент

Вычислительная биология раскрывает скрытые закономерности эволюции и заболеваний в нашей ДНК

Почти два десятилетия назад в рамках проекта "Геном человека" была составлена первая полная карта наших генов, в которой были обещаны новые грандиозные открытия о заболеваниях и их лечении. Правда информации было так много, что структурировать её надлежащим образом удалось еще не скоро. Сейчас биологи при помощи компьютеров, обладающих необходимой вычислительной мощностью, используют достижения в области машинного обучения и добычи данных, чтобы начать делать то, что не мог сделать человеческий разум в одиночку. Они проводят сравнения между индивидуумами и видами, ищут осмысленные закономерности. Они определяют какие части генома при мутации с наибольшей вероятностью могут вызвать заболевание. А некоторые начали применять новые аналитические инструменты для спасения жизней.

https://pixabay.com/ru/photos/%D1%88%D0%B0%D1%80%D0%BE%D0%B2-%D0%B4%D0%B8%D0%B7%D0%B0%D0%B9%D0%BD-%D1%81%D0%BA%D1%83%D0%BB%D1%8C%D0%BF%D1%82%D1%83%D1%80%D0%B0-%D1%83%D0%BA%D1%80%D0%B0%D1%88%D0%B5%D0%BD%D0%B8%D0%B5-779573/
https://pixabay.com/ru/photos/%D1%88%D0%B0%D1%80%D0%BE%D0%B2-%D0%B4%D0%B8%D0%B7%D0%B0%D0%B9%D0%BD-%D1%81%D0%BA%D1%83%D0%BB%D1%8C%D0%BF%D1%82%D1%83%D1%80%D0%B0-%D1%83%D0%BA%D1%80%D0%B0%D1%88%D0%B5%D0%BD%D0%B8%D0%B5-779573/

"Мы начинаем видеть применение подходов машинного обучения в интерпретации генетических вариаций у человеческих пациентов", - говорит Дэвид Голдштейн, директор-основатель Института геномной медицины при Медицинском центре Колумбийского университета.

Этот подход был впервые применен в Калифорнийском университете в Санта-Крус (UCSC) в начале 2000-х годов, при этом большую часть ключевой работы выполнил молодой аспирант, имеющий опыт работы в области биологии и компьютеров, по имени Адам Сипэл (Adam Siepel). К тому времени генетики уже секвенировали гораздо меньший генетический код одного вида рыбы, который имел название Fugu. Вскоре после этого они завершили работу над геномом человека, за которым быстро последовали геномы мышей и крыс. Исследователи выстроили различные коды для сравнения, надеясь определить наиболее важные генетические регионы, говорит Джим Кент, ученый-исследователь из UCSC, который возглавил работу по соединению этого первого полного генома человека.

После того, как Кент и его коллеги подвели итоги проекта, компания Сипэла разработала программу, которая превратила межвидовое сравнение в поисковую базу данных. Цель состояла в том, чтобы позволить исследователям во всем мире ввести конкретные генетические последовательности и получить результат, предсказывающий, насколько вероятно, что эта последовательность будет иметь определенное функциональное значение. Кент и его команда аргументировали это тем, что если определенный кусок ДНК появляется почти одинаковым у разных видов (т.е. если он "сильно консервирован"), то в терминологии генетики он должен иметь решающее значение для жизни.

"Мы искали гены, которые выглядели так, как будто они были под очень сильным отбором, чтобы остаться неизменными в течении миллионов лет. Ведь если они были сохранены эволюцией, значит они, вероятно, очень важны", - говорит Сипэл, который в настоящее время является председателем Центра количественной биологии Саймонса в лаборатории Cold Spring Harbor, частном некоммерческом научно-исследовательском учреждении на Лонг-Айленде.

Пропуская генетические данные через компьютерные программы распознавания образов, компания Сипэл разработала математические модели эволюции, которые идентифицировали генетические последовательности. Эти последовательности, вероятно, будут существенными для выживания. Модели были включены в "Браузер генома" UCSC, общедоступный ресурс, содержащий копию генома человека и ряд других инструментов для его осмысления. Ресурс также включает средства визуализации и базы данных, которые позволяют генетикам вводить конкретный ген и подбирать аннотации, объясняющие то, что в настоящее время известно о его роли и функциях.

Часть 2