К Международному дню ДНК: Как современные технологии помогают «читать» геном

3 дня назад3 дня назад

4 мин

Ежегодно 25 апреля в разных странах мира отмечается Международный день ДНК. Дата посвящена одному из важнейших открытий в истории науки – расшифровке структуры молекулы дезоксирибонуклеиновой кислоты, то есть ДНК. 25 апреля было выбрано в память о том, что именно этот день в 1953 году в британском журнале «Nature» ученые Джеймс Уотсон и Фрэнсис Крик совместно с Морисом Уилкинсом и Розалинд Франклин опубликовали результаты исследования структуры молекулы ДНК. История продолжилась 50 лет спустя, когда 25 апреля 2003 года было объявлено, что проект по расшифровке генома человека близок к завершению. Смысл Международного дня ДНК – в осознании роли генетики в жизни человека, в понимании механизмов наследственности и в признании научного прогресса. В России впервые День ДНК отметили 24-25 апреля 2009 года в Красноярском государственном медицинском университете. В современном мире праздничная дата особенно актуальна на фоне развития персонализированной медицины, биотехнологий и геномных иссле

Оглавление

Осознание роли генетики в жизни человека
Автоматизированные программы, базы данных и биоинформатические инструменты

Осознание роли генетики в жизни человека

25 апреля было выбрано в память о том, что именно этот день в 1953 году в британском журнале «Nature» ученые Джеймс Уотсон и Фрэнсис Крик совместно с Морисом Уилкинсом и Розалинд Франклин опубликовали результаты исследования структуры молекулы ДНК. История продолжилась 50 лет спустя, когда 25 апреля 2003 года было объявлено, что проект по расшифровке генома человека близок к завершению.

Смысл Международного дня ДНК – в осознании роли генетики в жизни человека, в понимании механизмов наследственности и в признании научного прогресса. В России впервые День ДНК отметили 24-25 апреля 2009 года в Красноярском государственном медицинском университете.

В современном мире праздничная дата особенно актуальна на фоне развития персонализированной медицины, биотехнологий и геномных исследований. В ДНК хранится генетическая информация человека, поэтому такой тест стал одним из наиболее используемых в медицинской генетике.

Автоматизированные программы, базы данных и биоинформатические инструменты

В Медико-генетическом научном центре имени академика Н.П. Бочкова ученые активно применяют современные технологии секвенирования, которые помогают узнать как можно больше о наследственных заболеваниях. Так, в информационно-аналитического отделе МГНЦ для обработки, интерпретации и визуализации больших объемов данных, полученных в результате современных биологических исследований, таких как секвенирование генома, транскриптомика, протеомика, используют разнообразные методы, в том числе, созданные специалистами центра.

Для хранения и анализа данных о метилировании ДНК сотрудники используют систему ClickHouse – быструю базу данных, разработанную в Яндексе для работы с большими массивами информации в реальном времени.

«Система ClickHouse устроена так, что поиск нужных значений среди миллиардов записей занимает доли секунды. А специальные алгоритмы сжатия уменьшают объем данных в четыре раза по сравнению с обычными форматами хранения. ClickHouse работает с привычным языком запросов SQL, который используется в аналитике повсеместно. Поэтому не нужно тратить время на разбор технических нюансов разных систем – можно сосредоточиться на самом анализе», – рассказал специалист по информационным технологиям информационно-аналитического отдела Антон Смирнов.

Специалист по информационным технологиям информационно-аналитического отдела, к.т.н.Никита Бескоровайный добавил, что на основе ClickHouse также разработана и внедрена база частот вариантов нуклеотидных последовательностей по всем образцам данных NGS, включая панели генов, экзомные и полногеномные. По мнению эксперта, в перспективе это открывает возможности создания удобного сервиса для различных исследований, связанных с популяционными частотами вариантов.

«Мы создали автоматизированную программу ACMG_SF_Classifier, которая помогает врачам находить важные, но неожиданные генетические изменения, так называемые «вторичные находки». Это патогенные генетические варианты, случайно выявленные при полноэкзомном или полногеномном секвенировании, которые не связаны с причиной обращения пациента, но существенно повышающие риск развития тяжелых, поддающихся лечению заболеваний. На сегодняшний день, в соответствии с рекомендациями ACMG SF v3.3, обязательный для анализа перечень включает в себя 84 гена», – рассказала сотрудник ЦКП «Геном» Анна Басова. По ее словам, программа объединяет данные из разных источников: частоту встречаемости генетических вариантов в популяции, прогнозы их влияния на работу белков и информацию из медицинских баз данных. Результаты оцениваются по международным критериям ACMG с учетом специфики каждого гена. Это позволяет стандартизировать медицинские заключения, снизить нагрузку на генетиков и снизить риск пропуска важных находок.

Исследуя молекулярные механизмы генетических заболеваний, ученые разрабатывают и внедряют биоинформатические инструменты для анализа транскриптомных и геномных данных.

«В 2025 году мы создали программу для изучения генетических вариантов, потенциально нарушающих сплайсинг, на основе анализа транскриптомных профилей. Также реализовали подход к формированию и анализу контрольной выборки, что повышает точность интерпретации результатов, и разработали инструмент для анализа длинных прочтений генома, предназначенный для диагностики болезней экспансий», – поделился достижениями специалист по информационным технологиям информационно-аналитического отдела Евгений Щока. Технологии длинных прочтений обеспечивают более полную и точную информацию по сравнению с короткими ридами, что позволяет улучшить детекцию вариантов в сложных и плохо картированных участках генома.

В группе диагностики заболеваний с неустановленной генетической причиной специалисты отдела внедряют собственные биоинформатические инструменты, в том числе, на основе искусственного интеллекта. Например, ученые разработали языковую модель для автоматического поиска терминов HPO в русскоязычных текстах, что ускоряет стандартизацию фенотипов, а также ИИ-решения для мониторинга новых описаний заболеваний до их официального включения в основные базы данных Orphanet, OMIM.

«Такая работа позволит автоматизировать преданализ для случаев без молекулярно-генетического подтверждения и оперативно связывать фенотипы пациентов с еще не каталогизированными генетическими синдромами. Кроме того, разработана детекция процессированных псевдогенов, которые могут быть не замечены при стандартной аннотации. Для сложных случаев, не поддающихся анализу на линейном референсе, тестируются подходы по использованию пангеномного референса, позволяющие улучшить видимость вариантов в регионах с высокой гомологией», – пояснил руководитель группы диагностики заболеваний с неустановленной генетической причиной информационно-аналитического отдела, к.м.н. Артем Боровиков.

Медицина

1,97 млн интересуются