Как прочесть генетический код сразу множества людей и не запутаться
Технология, которую использует для типирования доноров казанская лаборатория Русфонда, кажется научной фантастикой. Но она работает.
⭐Непохожие близнецы
Организм человека устроен на первый взгляд глуповато. Представьте себе мэра большого города, который ввел драконовскую паспортную систему. Каждый горожанин с рождения и до смерти обязан носить с собой и предъявлять по первому требованию документы не только собственные, но и всех прочих жителей. Как кого зовут, когда кто родился, где живет, кем работает, чем болеет – каждый должен все знать обо всех. Зачем? Бессмыслица. Но в живом организме все именно так.
В каждой из 30 трлн наших клеток есть 46 скрученных в спираль хромосом, в которых зашифровано все, что организму досталось от рождения.
Цвет глаз, рост, болезни, будущая седина в волосах, склонность к полноте.
Но криминалистам и генетикам это только на руку. Геном человека они могут найти где угодно – в коже, слюне, волоске в носу. Для типирования потенциальных доноров в России обычно используют кровь. Типирование донора – это составление его генетического портрета. Точнее, крошечного кусочка этого портрета: не всех 40 тысяч генов, а только нескольких – генов тканевой совместимости. Их называют генами HLA. Почему – долго объяснять. Прочтите здесь, если хотите.
Люди с одинаковыми генами HLA могут стать друг для друга донорами костного мозга. Их часто называют генетическими близнецами, хотя все их сходство – маленький участок шестой хромосомы, где обитают гены HLA. Врачи уверяют, что такие «близнецы» совершенно не обязаны быть похожими: гены HLA не управляют внешностью.
Найти генетического близнеца пациенту, которому нужна пересадка костного мозга, очень трудно.
Кажется, нигде в человеческом геноме нет такого разнообразия вариантов (их называют аллелями), как в генах HLA. У пяти «главных» генов тканевой совместимости сотни и тысячи аллелей.
За несколько десятилетий сменили друг друга несколько методов их расшифровки. Революция произошла с появлением NGS – next-generation sequencing, секвенирования нового поколения и соответствующего оборудования, секвенаторов. Именно его использует лаборатория в Казани, созданная два года назад Русфондом вместе с Институтом фундаментальной медицины и биологии Казанского федерального университета.
Секвенирование – определение последовательности букв генетического кода. Своего рода чтение.
Прелесть технологии NGS в том, что она позволяет одновременно читать много генов многих людей.
Отсюда скорость, отсюда же и дешевизна. Заведующая казанской NGS-лабораторией Елена Шагимарданова рассказала, как все это происходит.
⭐Выделяй и властвуй
– Когда к нам приходят пробирки с кровью, мы сразу же присваиваем каждой бар-код, чтобы дальше уже не было никаких персональных данных, только цифры.
Нам нужно выделить из крови ДНК. С помощью специального раствора мы разрушаем мембрану клеток – ДНК и все остальные элементы вываливаются наружу. Теперь надо очистить ДНК от всего лишнего – мы пропускаем содержимое клеток через специальную колонку. Молекулы ДНК в ней остаются, а все остальное уходит. Затем мы смываем с колонки и ДНК, чтобы использовать ее в дальнейшей работе.
В ДНК человека около 20 тысяч генов. А нас в ней интересуют только пять
(некоторые лаборатории для HLA-типирования исследуют больше генов. – Кровь5). Чтобы секвенатор смог прочесть эти гены, их нужно амплифицировать – размножить с помощью полимеразной цепной реакции (ПЦР). Для этого много чего требуется.
Во-первых, праймеры – молекулы, которые умеют находить гены, которые нам нужны, и прикрепляться к ним. Во-вторых, сама полимераза – фермент, который, ориентируясь на метки, осуществляет размножение. В-третьих, нуклеотиды – кирпичики, из которых будут строиться копии генов. Размножение занимает пять-шесть часов – вечером запускаем, а утром все уже готово.
⭐Библиотечный день
– Теперь у нас есть нечто, содержащее множество копий нужных нам генов. Мы должны подготовить их к чтению. Это так и называется: подготовка библиотеки. Это включает в себя несколько манипуляций. Мы режем гены на более короткие фрагменты, потому что секвенатор не умеет читать длинные последовательности.
А дальше происходит очень интересная вещь. Мы же хотим одновременно анализировать ДНК многих людей. Возможности нашего прибора – до 280 человек за раз. До сих пор генетический материал каждого донора находился в отдельной пробирке.
А тут мы «приклеиваем» к каждому кусочку ДНК молекулу-идентификатор. Сколько людей, столько и идентификаторов – по ним мы потом поймем, где чья ДНК. Теперь образцы можно слить в одну общую емкость.
Все это мы загружаем в секвенатор MiSeq – наш прибор для чтения.
⭐Секреты скорочтения
– Вы читаете буквы в книжке, а наша лаборатория – нуклеотиды в геноме. В чем-то нам даже проще.
В русском алфавите 33 буквы, а в генетическом – всего четыре: А (аденин), G (гуанин), C (цитозин) и T (тимин).
Разные последовательности букв образуют «генетические слова», слова складываются в «генетические фразы», в которых записана вся наследственная информация.
Как прочесть букву? Мы используем специальные молекулы четырех видов, каждый может прикрепляться только к одной из букв. И не просто прикрепляться, а еще и излучать при этом свет. Секвенатор пропускает через загруженный в него материал молекулу-маркер для буквы A – и понимает, что всюду, где начало светиться, стоит А, нуклеотид аденин. И запоминает эту информацию. Потом выпускает другую молекулу-маркер, и так много циклов подряд. Последовательно, букву за буквой, секвенатор считывает структуру всех кусочков ДНК, которые в него загружены.
Есть загвоздка. Секвенатор прочел только фрагменты генов. Любой ген HLA намного длиннее последовательности, которую наш прибор в состоянии прочесть. Например, в гене HLA-A 7 тысяч «генетических букв». Тут все как в языке. Я вам показываю четыре фрагмента: «азин», «Ва», «шелвмаг», «сяпо». Вы же, если подумаете, сможете собрать из них «Вася пошел в магазин»? В секвенаторе то же самое, только кусочков гораздо больше и они могут перекрываться. Поэтому собирать из них фразы мы поручаем компьютеру – есть специальная программа.
⭐Старые знакомые и новички
– Мы довольно хорошо знаем, какие аллели бывают у генов тканевой совместимости. Собрав пазл из кусочков генов, которые в него загружены, секвенатор получает последовательности генетических букв каждого из пяти генов каждого из 280 людей. 1400 очень длинных цепочек. Что дальше? Эти цепочки сравниваются с базой данных, где записаны все известные нам аллели этих пяти генов, все известные цепочки. Многие тысячи вариантов. Гены HLA обозначают буквами A, B, C, DR и DQ, а дальше идет несколько цифр, которые шифруют эти самые варианты – аллели. Ну например, HLA-A*02:01:01.
Когда собираешь очень большой пазл, цена ошибки велика. Вставил кусочек, вроде бы подошел, а на самом деле нет – и все пошло не так.
Техника может ошибаться. Поэтому мы, люди, должны мониторить результаты секвенирования. Например, образец мог оказаться загрязненным, и секвенатор мог прочесть его неправильно.
А бывает так, что мы обнаруживаем новый аллель – такой, с которым до нас ни одна лаборатория в мире не сталкивалась. Мы его отправляем на проверку в общую международную информационную базу IMGT (ImMunoGeneTics information system) Если все правильно, наш аллель включают в базу, которая обновляется раз в три месяца.
⭐Время и деньги
– У нас расклад по времени такой. Первый этап – пока зарегистрируем все пробирки, выделим ДНК, проведем ПЦР, подготовим пробы для анализа – это один-два дня. Трое суток работает секвенатор. Дальше – самая трудоемкая часть: анализ данных. Но ведь у нас поток: пока анализируем, уже можно запускать следующую партию.
Главный наш прибор – секвенатор. После него с данными работают только компьютеры и люди. А до него – много приборов. Аппарат для выделения ДНК, ПЦР-амплификаторы, другое оборудование.
И каждому прибору нужны свои реагенты – вещества, участвующие в реакциях, которые в этом приборе происходят. Мы их покупаем наборами.
Есть набор для выделения ДНК. Еще один, самый дорогой, – для ПЦР и подготовки библиотеки. Третий – для самого секвенирования, его нам поставляет компания Illumina, производитель секвенатора. В нем есть картридж для секвенирования, светящиеся маркеры, много чего еще.
В этой области все ужасно быстро совершенствуется. NGS нет смысла даже сравнивать с прежними технологиями.
Вспомните: первое секвенирование человеческого генома стоило 3 млрд долларов и заняло десять лет – с 1990 по 2000 год. NGS позволяет сделать это за тысячу долларов в течение суток.
А ведь уже появился еще более продвинутый метод – TGS, third-generation sequencing. Такой аппарат способен читать гораздо более длинные генетические фразы. Это очень круто. Но пока и очень дорого.
***
При полной загрузке MiSeq одно типирование обходится Русфонду, с учетом всех накладных расходов, в 9600 рублей в расчете на одного донора. Это очень низкая цена, и получается она благодаря тому, что типируют 280 человек одновременно.
9600 рублей – это примерно втрое меньше расходов на типирование в центрах Минздрава.
Или по-другому: за те же деньги мы можем включить в Национальный регистр доноров костного мозга имени Васи Перевощикова (Национальный РДКМ), который строит Русфонд, втрое больше потенциальных доноров и таким образом увеличить вероятность того, что для каждого нуждающегося в трансплантации в регистре найдется свой генетический близнец.
У Национального РДКМ нет никаких других денег, кроме пожертвований. Для каждого донора типирование бесплатно, но, чтобы доноров становилось больше, нужны не только добровольцы, желающие спасти другого человека, но и неравнодушные люди, готовые помочь деньгами на реагенты.
Если вы решите поддержать регистр, сделать это можно по ссылке. А мы говорим большое спасибо нашим жертвователям – ведь без них мы не могли бы работать.
Оригинал статьи на сайте Кровь5.рф
🛑🛑🛑Здесь собраны портреты и рассказы людей, которые имеют прямое отношение к донорству костного мозга.
Главные вопросы о донорстве костного мозга
👉🏼Читайте на нашем сайте по ссылке.