"Любая достаточно развитая технология неотличима от магии, это третий закон Артура Кларка. И это в полной мере относится к секвенированию" (Дмитрий Кривошеев, медико-генетический центр «Генотек»).
Что такое секвенирование и зачем оно нам?
ХХ век был веком исследования генов, XXI век стал веком геномики (исследования целых геномов), анализа огромных объемов генетической информации. Вероятно, в ближайшее время наибольшую долю новых данных, которая накапливаются в мире, составит информация о генетических последовательностях.
Секвени́рование биополимеров (белков и нуклеиновых кислот — ДНК и РНК) — определение их аминокислотной или нуклеотидной последовательности (от лат. sequentum — последовательность).
Зачем нам знать их последовательность? Знать их последовательность - значит "прочесть" ген, узнать мутации в нём, иметь его последовательность - значит, уметь его синтезировать и делать над ним прочие манипуляции генной инженерии.
В самом начале, секвенировали отдельные гены или их участки. В микробиологии, например, так можно найти у вас какого-то микроба. И такие тесты на инфекции методом ПЦР сдавали все в своей жизни. Хотя иногда так можно и не секвенировать ген, а просто найти меткой его участок и этого может быть достаточно. Но для того, чтобы найти этот участок и сделать набор для анализа, всё равно нужно отсеквенировать куски у близких микробов, сравнить их и найти то важное место, где ваш микроб отличается от других штаммов или видов.
Код жизни: прочесть не значит понять отсылка с философским, но точным названием
Стоимость чтения ДНК снижается быстрее, чем по закону Мура, — за 20 лет она упала с миллиардов до тысячи долларов за геном и продолжает уменьшаться. Падение стоимости произошло в значительной мере благодаря NGS. Секвенирование становится все более доступным и находит все новые применения.
Всюду любят пихать график, как падала за 20 лет стоимость секвенирования, и как росло число отсеквенированных геномов, - поэтому я не буду его приводить. В принципе, из дорогостоящей эта операция превратилась в обыденную во многих лабораториях во всём мире. И сегодня масса фирм предлагает отсеквенировать ваш геном и найти мутации, чтоб сделать рекомендации в духе персонализированной медицины, рассказать о вашем происхождении и родстве, о предрасположенностях и пр. Прочитать геном одного человека сегодня стоит не более тысячи долларов, а раньше этим занималась огромная научная международная сеть, и стоило это до сотни млрд.
Понятно, что секвенируют не только человеческие, но и геномы вирусов и бактерий, растений и животных. Понятно, что и синтезировать небольшой геном - не так и сложно.
Интересно, что начальные этапы развития Ancestry (одной из компаний потребительской генетики в Штатах) связаны с церковью мормонов — в их религиозных воззрениях важную роль играют генеалогические связи. Джеймс Соренсон, мормонский миллиардер и филантроп, создал базу генетических данных, которую позднее приобрела Ancestry; эта компания продолжает сотрудничать с мормонами.
Каждый из нас — невероятная смесь генетических маркеров разных этносов, поэтому никакое этнически ориентированное оружие создать невозможно.
Есть довольно успешные попытки оценить влияние генетических факторов на интеллект, например, полигенный предиктор «предрасположенности» к высшему образованию, использующий 74 SNP, оказался довольно точным.
Наконец, новый этап в развитие микробиологии открыло метагеномное секвенирование — чтение всех геномов в образце, позволяющее оценить состояние почвы или кишечной микрофлоры - любого биотопа без культивирования.
Первые методы секвенирования
За них учёные получали нобелевские премии. В России нет таких, но важно отметить, что русские биологи были одними из первых, кто открыл термостабильные ферменты, которые там используются. (Плюс вобще есть байка про одного товарища, который вроде бы переехал в США, захватив наработки, причём, сам вроде бы не имел к ним самого прямого отношения. Честно, не знаю, насколько это так). Тут ещё история, что опубликовали они в русском журнале, а как известно, на Западе они не котируются, но, очевидно, читаются.
История технологий секвенирования началась в середине ХХ века. Английский биохимик Фредерик Сенгер (1918–2013) — человек, получивший две Нобелевские премии по химии, за разработку методов определения последовательности белков и ДНК.
Секвенирование по Сенгеру и по Максаму – Гилберту (их теперь относят к первому поколению методов секвенирования) появились практически одновременно, но второе, основанное не на достраивании цепочки ДНК, а на ее расщеплении, не получило широкого распространения. (Нобелевскую получили все).
В то же время, автоматизированное секвенирование, использующее метод синтеза ДНК с терминацией, разработанный Сенгером, и капиллярный электрофорез, остается золотым стандартом и сегодня. (Сенгер предложил еще и второй метод, (+/-)-систему секвенирования, но она быстро сошла со сцены).
Секвенирование нового поколения
Затем появилось собственно NGS — секвенирование нового поколения (next generation sequencing), оно же высокопроизводительное секвенирование. После появления методов одномолекулярного секвенирования (Pacific Bioscience и Oxford Nanopore) методы NGS стали называть «вторым поколением».
«Высокопроизводительное» оно потому, что одновременно выполняются миллионы или даже миллиарды чтений. Методы NGS, как и секвенирование по Сенгеру, представляют собой секвенирование путем синтеза (СПС, sequencing by synthesis, SBS) — они основаны на достраивании цепи, комплементарной той, которую надо прочитать. Образец расщепляется на фрагменты небольшого размера, желательно случайным образом, без предпочтения определенных сайтов (поэтому часто используют ультразвук). Каждый фрагмент закрепляется на твердой поверхности и амплифицируется. Методы амплификации — создания множественных копий фрагмента нуклеиновой кислоты — берут свое начало от полимеразной цепной реакции (ПЦР), изобретенной Кэри Муллисом.
Множество копий одного фрагмента, локализованное на чипе, обычно называется кластером. На этих копиях строят комплементарные цепочки и в момент присоединения очередного нуклеотида тем или иным образом регистрируется сигнал.
Ну и не поверите, оборудование от такого
стало таким
На самом деле, всё используется - просто в разных целях..
Причём тут биоинформатика
На самом деле, секвенирование порождает огромный пласт данных, которые невозможно посчитать в голове, на калькуляторе и даже ПК без разработки соответствующего софта.
В человеческом геноме 3 млрд. букв – пар нуклеотидов, 20 000-23 000 генов, а геном аксолотля в 10 раз больше генома человека. И эти млрд букв надо не просто прочитать, но и найти там что-то, а иногда сравнить с другими наборами млрд - другими геномами.
Секвенированный (расшифрованный) геном лишь одного человека «весит», по разным оценкам, в среднем 500 гигабайтов.
Инсайт для эволюционистов, базирующихся на филогенетическом анализе:
По генетическому строению к человеку ближе всего шимпанзе: у человека с ними 96% общих генов. С абиссинскими кошками нас объединяет 90% наследственного материала, а с мышами — 85%. С мушками дрозофилами у нас 65% общих генов, а с бананами — 60%.
Размер генома, в чем бы мы его ни пытались посчитать, поразительно не связан со сложностью устройства организмов. Этот парадокс назвали "загадкой значений С", где С — это количество ДНК в клетке (C-value paradoх, точный перевод — "парадокс величины генома"). И все-таки какие-то корреляции между видами и царствами существуют.
Ну и чего только не накопаешь в геномах. Например, сначала ученые нашли предка змей и установили, что он обладал четырьмя ногами и жил в норках (Nicholas Longrich нашел в Бразилии и опубликовал в Science), а затем ученые стали утверждать, что змеи лишились ног во времена динозавров 100 миллионов лет назад благодаря трем мутациям в ДНК, и всё благодаря изучению геномов. Вот такие чудеса науки и техники!