В середине мая в Nature вышла статья, в которой ученые из Кембриджа описали процесс синтеза de novo и сборки в живом организме самого большого на сегодняшний день генома — кольцевой хромосомы кишечной палочки Escherichia coli. Исследователи не просто создали бактерию с синтетическим геномом, но и изъяли из обращения два кодона, кодирующих аминокислоту серин, получив таким образом организм с сокращенным генетическим кодом. По сравнению с той информационной шумихой, которую создавал Крейг Вентер (пионер исследований генома человека и директор института имени себя) вокруг своих проектов по синтетической геномике (речь идет, в первую очередь, о создании первого организма с синтетическим геномом и бактерии с минимальным геномом), новость о «подмене» хромосомы кишечной палочки прошла практически незаметно. Тем не менее, это важная веха в области синтетической биологии, ведь речь идет о четырех миллионах пар оснований, которые были получены в лаборатории из раствора нуклеотидов и затем попали в живую клетку. Разбираемся, как синтезировать геном в лаборатории, зачем ученые вообще занимаются подобными вещами и что нового произошло в синтетической геномике со времен «первого синтетического живого организма», опубликованного в 2010 году командой Крейга Вентера.
Синтез целых геномов — раздел синтетической биологии, которая ставит своей задачей создание организмов с заданными свойствами при помощи современных методов генной инженерии.
Вообще-то, принципы синтетической биологии давно используются и в области индустриальной микробиологии для создания микробов — сверхпродуцентов ценных молекул, и в экологии (например, для создания биосенсоров), и в других областях биологии. Отличие синтетической биологии скорее в том, что это междисциплинарное направление, объединяющее несколько крупных проектов, таких как создание вычислительных устройств на основе живых систем или создание организмов с дизайнерскими геномами, синтезированными de novo.
Как это делается
Синтез ДНК в лаборатории сам по себе не является сложной задачей — методики, позволяющие построить цепочку с заданной последовательностью нуклеотидов, были разработаны еще в 80-х годах XX века. Однако ситуация в области синтетической геномики с методической точки зрения напоминает ситуацию с секвенированием в начале проекта по расшифровке генома человека — технологии уже есть, но еще крайне непроизводительные. В результате, чтобы синтезировать даже самый короткий геном, придется опираться на схему «маленькие кусочки — кусочки побольше — большие куски — целая молекула».
Наиболее популярный и дешевый амидофосфитный метод синтеза ДНК-цепочек на твердофазном носителе позволяет провести не более 100-200 циклов последовательного присоединения нуклеотидов, причем вероятность ошибочного присоединения с каждым циклом увеличивается. Таким образом, на выходе можно получить короткие одноцепочечные молекулы ДНК (олигонуклеотиды), состоящие максимум из 200 звеньев.
Альтернативой этому методу может стать ферментативный синтез с использованием терминальной дезоксинуклеотидил трансферазы (TdT). Этот фермент работает как ДНК-полимераза, удлиняя цепочку за счет присоединения новых нуклеотидов, но для синтеза ему не нужна матрица. Ферментативный подход может увеличить точность синтеза, но, судя по всему, не длину готового продукта. Пока что максимальная длина цепочки, полученной таким образом, составила 150 нуклеотидов. Кроме того, для коммерческого использования технология пока недоступна.
Несмотря на ограничение по длине, такая продуктивность синтеза до недавних пор устраивала большинство пользователей. Короткие цепочки ДНК используются во множестве биологических приложений — в качестве затравок для полимеразной цепной реакции, в качестве зондов для детекции последовательностей, подавления экспрессии генов и мутагенеза. Тем не менее, появление синтетической биологии привело к росту конкуренции на рынке синтеза, в результате чего цены заметно упали. Заказать синтез целого гена длиной в несколько сотен или тысяч нуклеотидов теперь может позволить себе большинство исследовательских лабораторий.
Чтобы синтезировать даже единственный ген, на старте придется иметь дело с большим количеством коротких олигонуклеотидов. На этапе дизайна эксперимента последовательность ДНК разбивают так, чтобы последовательности этих олигонуклеотидов перекрывались друг с другом. Дальше олигонуклеотиды смешивают по несколько штук и объединяют при помощи полимеразной цепной реакции. Этот метод тоже был изобретен еще в конце 80-х и так сильно подстегнул развитие молекулярной биологии, что за его разработку вручили Нобелевскую премию.
В реакции, состоящей из множества циклов последовательного разделения и отжига цепочек друг на друга, используется термостабильная ДНК-полимераза, которая достраивает вторую цепь ДНК на одноцепочечной матрице. В результате короткие перекрывающиеся кусочки можно не только сшить друг с другом, но и многократно копировать.
Далее куски ДНК объединяют в большие фрагменты путем ферментативной сборки, или, что проще, с использованием в качестве «швеи» клетки пекарских дрожжей. За счет усиленной способности к рекомбинации ДНК дрожжи могут объединить друг с другом много перекрывающихся последовательностей. Именно таким способом был собран геном «синтетической микоплазмы», причем дрожжи смогли соединить одновременно 25 кусков ДНК.
Большие фрагменты генома кишечной палочки были собраны таким же образом. Однако для создания промежуточных форм хромосомы пришлось полагаться на рекомбинацию в клетках самой бактерии. Обычно небольшие фрагменты ДНК несложно встроить в бактериальный геном, однако для встройки кусков ДНК размером по 100 тысяч пар оснований пришлось применять метод на основе CRISPR с внесением двуцепочечных разрывов.
Что синтезируется
С большой вероятностью читатели слышали об экспериментах с геномами микоплазмы, которые проводит команда Вентера, — например, о создании бактерии с минимальным геномом мы писали в 2016 году.
Микоплазмы — самые маленькие и просто устроенные бактерии с маленькой кольцевой хромосомой. Именно геном Mycoplasma genitaliumразмером 582970 пар оснований стал первым проектом по синтезу ДНК живых организмов. Его результаты были опубликованы в 2008 году, а в 2010-м ученые из института Вентера сообщили в статье в Science, что вдвое больший геном Mycoplasma mycoides был не только синтезирован, но и внедрен в клетку и стал реплицироваться, что дало авторам основание говорить о «первом синтетическом живом организме».
Тем не менее, точкой отсчета в синтетической геномике принято считать не эксперименты Вентера, а эксперименты с геномами вирусов (по традиции, вирусы живыми организмами не считаются, так как не способны к воспроизводству вне клетки-хозяина).
В 2002 году была опубликована статья о синтезе ДНК, соответствующей РНК-содержащему геному полиовируса типа 1 (возбудителя полиомиелита). Размер ДНК-прототипа вирусного генома составил всего 7500 пар оснований, но на тот момент это был самый большой ДНК-фрагмент, созданный исключительно средствами биохимии. Синтетический геном содержал 27 нуклеотидных замен в качестве генетических маркеров, или опознавательных знаков.
За полиовирусом последовал геном вируса гриппа, который синтезировали в 2005 году. Исследователи сначала по крупицам воссоздали последовательность генома вируса, который в 1918-1919 годах вызвал эпидемию «испанки». Сделано это было при помощи обратной транскрипции с коротких обрывков РНК, выделенных из сохранившихся тканей жертв. Затем последовательность ДНК-копии генома вируса воссоздали в лаборатории в составе безопасной кольцевой молекулы (плазмиды). Впоследствии отдельные гены этого штамма ученые использовали в лабораторных моделях для анализа причин смертоносности этой разновидности вируса.
Промежуточный рекорд по размеру синтезированного генома (точнее, опять же, его ДНК-копии) был поставлен в 2008 году, когда ученые, пытаясь разобраться в причинах вспышки атипичной пневмонии, получили в лаборатории последовательность генов размером почти 30 тысяч пар оснований коронавируса SARS из летучей мыши.
Однако уже в том же году вышла статья Дэниела Гибсона о синтезе генома микоплазмы в полмиллиона пар. Описанные в статье новые методы сборки последовательностей были взяты на вооружение другими исследователями, так что с тех пор получение маленьких вирусных геномов перестало быть выдающимся достижением. Даже удивительно, что после «испанки» и SARS относительно недавняя статья о воссоздании вымершего вируса лошадиной оспы вызвалатакой широкий резонанс и обеспокоенность общественности.
Итак, первым живым организмом с дизайнерским геномом стала микоплазма. Еще до стадии синтеза в последовательность ее генома при планировании эксперимента были введены замены, позволяющие не просто оставить опознавательные знаки, но и закодировать новую информацию, например электронный адрес сотрудника института. Однако микоплазма — в перспективе объект не слишком полезный. Куда важнее было разработать методологию для синтеза генома кишечной палочки.
Чем важна E. coli
Escherichia coli — не только классический объект молекулярной биологии, но и «рабочая лошадка» биотехнологии. Сотни штаммов E. coli были созданы для производства белков, аминокислот, витаминов, различных соединений, которые дешевле производить биотехнологически, чем выделять из природного сырья или получать при помощи химического синтеза.
Тем не менее, геном E.coli «дикого типа» содержит четыре с половиной миллиона пар оснований, и его сборка принципиально дороже и сложнее, чем геном микоплазмы.
В 2000-х годах при поддержке промышленности в Японии запустили проект по уменьшению генома кишечной палочки методами генной инженерии с тем, чтобы отбросить все «лишние» элементы и создать быстро растущий микроорганизм со стабильным геномом, идеальный для создания продуцентов чего угодно. Один из промежуточных этапов этого проекта, штамм под названием MDS42, лишился 600 тысяч пар оснований и стал объектом внимания синтетической биологии.
Одной из целей создания «синтетической» кишечной палочки разные группы исследователей ставили рекодирование генома, то есть сокращение числа природных нуклеотидных кодонов, кодирующих аминокислоты, или даже замену их специфичности на неканонические аминокислоты. Рекодирование возможно благодаря вырожденности генетического кода — для кодирования всего 20 канонических аминокислот, из которых состоят белки, и стоп-сигнала, используется целых 64 кодона.
Теоретически можно сократить количество кодонов для некоторых аминокислот и освободить таким образом место под новые. Кроме того, рекодирование изменяет исходную последовательность генов с сохранением их аминокислотного состава. Это, к примеру, позволяет исключить возможность использования генетического аппарата клетки для репликации вирусов.
Результат такого масштабного рекодирования был опубликован в 2016 году с участием одного из пионеров синтетической биологии Джорджа Черча. Авторы статьи в Science провели большую биоинформатическую работу, спланировали сборку генома из маленьких кусочков и решили при этом убрать целых семь кодонов, заменив их в геноме на синонимичные (то есть кодирующие то же самое).
Финальная хромосома должна была содержать более 60 тысяч замен. Тем не менее, экспериментально удалось проверить только 60 процентов последовательностей, создав ряд «полусинтетических» штаммов E.coli. Часть из них, по-видимому, оказалась нежизнеспособна.
Авторы недавней работы под руководством Джейсона Чина из Кембриджа решили быть скромнее и заменили всего три кодона в геноме E.coli. Эксперименту предшествовал масштабный компьютерный дизайн, включающий разбивку на короткие последовательности, удаление некоторых элементов и внесение опознавательных знаков. Ключевым этапом сборки стало создание нескольких «полусинтетических» штаммов, которые в ходе «полового процесса» рекомбинировали синтетическую ДНК между собой.
Этот эксперимент увенчался успехом, и на свет появилась кишечная палочка с синтетическим геномом размером чуть меньше четырех миллионов пар оснований.
И пекарские дрожжи
Тем временем исследователи работают над синтезом генома еще одного модельного организма, пекарских дрожжей Saccharomyces cereviseae. Дрожжи представляют собой простейший эукариотический организм, который, как и кишечная палочка, очень широко используется в фундаментальных исследованиях и биотехнологии. Геном пекарских дрожжей содержит уже 12 миллионов пар оснований, кроме того он состоит не из одной хромосомы, как у бактерий, а из 16.
Проект по синтезу первого эукариотического генома стартовал в 2011 году, и с тех пор консорциум под названием «Synthetic Yeast 2.0», или Sc2.0, в который вошли представители институтов из США, Великобритании, Австралии, Китая и Сингапура, отчитались о создании de novo шести дрожжевых хромосом. В рамках этого проекта был запущен учебный курс Build-A-Genome, который позволил привлечь к рутинной работе по сборке фрагментов студентов и старшеклассников.
Организаторы проекта планируют не просто воссоздать геном микроорганизма, но и уменьшить его на восемь процентов за счет удаления разного рода «генетического мусора», такого как повторяющиеся последовательности и транспозоны, а также интроны. Кроме того, в синтетические хромосомы можно вставлять сайты для рекомбинации фрагментов ДНК при помощи вирусного фермента Cre-рекомбиназы, «включением» которой можно запустить процесс перемешивания генома и направленной эволюции по технологии SCRaMbLE.
В 2003 году был успешно завершен проект Human Genome Project по определению последовательности генома человека. Теперь по следам этого международного проекта исследователи предложили запустить вторую часть — уже посвященную синтезу человеческого генома.
Концепция проекта Genome Project-write была опубликована в 2016 году, и совсем недавно организаторы объявили свою основную цель. Ей станет создание Ultra-Safe Cell («клетка в безопасности»), которая благодаря рекодированию будет устойчива к заражению вирусами. Основатели проекта надеются, что, также как проект по расшифровке генома человека привел к появлению дешевых технологий секвенирования, проект по его синтезу приведет к развитию и удешевлению технологий синтеза ДНК.
Зачем это надо
Джейсон Чин, под руководством которого был собран синтетический геном кишечной палочки, признался в комментарии для The New York Times, что его мотивировал в первую очередь исследовательский интерес. Он хотел знать, так ли необходим вырожденный генетический код? Можно ли создать жизнеспособный организм с урезанной таблицей кодонов? Тем не менее, синтетическая геномика имеет и чисто прикладной интерес, недаром проект по урезанию генома кишечной палочки был инициирован промышленниками.
Синтетические вирусы можно использовать для создания вакцин, а синтез и рекодирование геномов востребованных в биотехнологии микроорганизмов можно будет применять для получения несуществующих в природе белков с новыми свойствами. Кроме того, рекодирование позволит генетически изолировать модифицированные организмы и помешает им «сбежать» в окружающую среду.
Прямо сейчас индустрия нуждается в дешевых технологиях синтеза ДНК для метаболической инженерии, производства ферментов, лекарств и биотоплива. Проекты по воссозданию целых геномов, может быть, пока выглядят бессмысленной тратой ресурсов, но выхлоп в виде сопутствующих технологий от них может быть весьма ощутим.
Дарья Спасская