Найти в Дзене
XX2 ВЕК

Крохотные белковые пары могут скрывать секрет происхождения жизни

Группа учёных из Университета Иллинойса открыла удивительные эволюционные связи между генетическим кодом и крохотными фрагментами белков под названием дипептиды. Проанализировав миллиарды последовательностей дипептидов тысяч видов организмов, учёные обнаружили, что эти пары молекул указывают на ранние этапы происхождения жизни. Гены — строительные кирпичики жизни, а генетический код предоставляет инструкции для сложных процессов, заставляющих организмы функционировать. Но как и почему это стало так, как оно есть? Недавнее исследование Университета Иллинойса в Урбана-Шампейн по-новому освещает происхождение и эволюцию генетического кода, предоставляя важные знания для генной инженерии и биоинформатики. «Мы находим, что происхождение жизни загадочным образом связано с дипептидным составом протеома, коллектива белков в организме», — говорит Густаво Каэтано-Аноллес, профессор Медицинского колледжа Университета Иллинойса. Работа Каэтано-Аноллеса сконцентрирована на филогеномике, исследовани

Группа учёных из Университета Иллинойса открыла удивительные эволюционные связи между генетическим кодом и крохотными фрагментами белков под названием дипептиды. Проанализировав миллиарды последовательностей дипептидов тысяч видов организмов, учёные обнаружили, что эти пары молекул указывают на ранние этапы происхождения жизни.

Густаво Каэтано-Анольес. Изображение: Фотоиллюстрация Фреда Цвики (Fred Zwicky)
Густаво Каэтано-Анольес. Изображение: Фотоиллюстрация Фреда Цвики (Fred Zwicky)

Гены — строительные кирпичики жизни, а генетический код предоставляет инструкции для сложных процессов, заставляющих организмы функционировать. Но как и почему это стало так, как оно есть? Недавнее исследование Университета Иллинойса в Урбана-Шампейн по-новому освещает происхождение и эволюцию генетического кода, предоставляя важные знания для генной инженерии и биоинформатики.

«Мы находим, что происхождение жизни загадочным образом связано с дипептидным составом протеома, коллектива белков в организме», — говорит Густаво Каэтано-Аноллес, профессор Медицинского колледжа Университета Иллинойса.

Работа Каэтано-Аноллеса сконцентрирована на филогеномике, исследовании эволюционных связей между геномами организмов. Ранее его исследовательская группа построила филогенетические древа с указанием эволюционной истории белковых доменов (структурных единиц белков) и транспортной РНК (тРНК), молекулы, транспортирующей аминокислоты к рибосоме в ходе синтеза белка. В этом исследовании они изучили эволюцию дипептидных последовательностей (базовых молекул из двух аминокислот, соединённых пептидной связью), и обнаружили, что истории как доменов, так и тРНК и дипептидов — совпадают.

Жизнь на Земле началась 3,8 миллиарда лет назад, но гены и генетический код появились лишь через 800 000 миллионов лет, и существуют конкурирующие теории о том, как это произошло.

Некоторые учёные считают, что сначала появилась основанная на РНК ферментная активность, в то время как другие предполагают, что сначала белки стали работать вместе. Исследовательская работа Каэтано-Аннолеса и его коллег в течение последних десятилетий поддерживает вторую точку зрения, показывая, что взаимодействие между рибосомными белками и тРНК возникло на исторической шкале истории позднее.

«Жизнь работает на основе двух кодов, работающих рука об руку, — объясняет Каэтано-Аннолес. — Генетический код хранит инструкции в нуклеиновых кислотах (ДНК и РНК), в то время как белковый код говорит ферментам и другим молекулам, как поддерживать жизнеспособность и работоспособность клеток. Рибосома служит для этих двоих мостиком, клеточная белковая фабрика, которая собирает аминокислоты, переносимые молекулами тРНК в белки. Ферменты, загружающие аминокислоты на тРНК, именуются аминоацил-тРНК-синтетазами. Эти синтетазные ферменты выступают в роли хранителей генетического кода, следящих за тем, чтобы всё работало как следует».

«Почему жизнь основывается на двух языках — одном для генов, другом для белков?, — спрашивает Каэтано-Аноллес. — Мы до сих пор не знаем, почему существует эта двойственная система или что руководит связью между первым и вторым. Управление не может заключаться в РНК, в функциональном смысле она неуклюжа. С другой стороны, белки — эксперты в управлении мудрёного молекулярного аппарата клетки».

Протеом больше подходил на роль хранителя ранней истории генетического кода, а дипептиды играют особенно значимую роль в качестве ранних структурных модулей белков. Существует 400 возможных комбинаций дипептидов, количество которых у различных организмов варьируются.

Исследовательской группой был проанализирован массив данных 4,3 миллиардов дипептидных последовательностей 1561 протеома, представляющего организмы трёх надцарств жизни: архей, бактерий и эукариотов. Они использовали эту информацию для построения филогенетического древа и хронологии эволюции дипептидов. Они также картировали дипептиды на древе структурных доменов белков, чтобы посмотреть, не выявятся ли подобные закономерности.

В предыдущей работе исследователи строили филогенез тРНК, который помог получить временную шкалу вступления аминокислот в генетический код, где аминокислоты разбиты на три группы, основываясь на времени их появления. Старейшими были Группа 1, включавшая тирозин, серин и лейцин, и Группа 2, в которую были добавлены ещё 8 аминокислот. Эти две группы связаны с происхождением редактирования в синтетазных ферментах, исправлявших неточности в загрузке аминокислот, и ранним операционным кодом, установившим первые правила специфичности, обеспечивающие соответствие каждого кодона отдельной аминокислоте. В Группу 3 входили аминокислоты, появившиеся позже и связанные с производными функциями, относящимися к стандартному генетическому коду.

Учёные уже продемонстрировали совместную эволюцию синтетаз и тРНК относительно появления аминокислот. Теперь они могли добавить в анализ дипептиды.

«Мы обнаружили, что результаты согласуются, — объясняет Каэтано-Аноллес. — Согласованность — ключевое понятие в филогенетическом анализе. Это означает, что утверждение об эволюции, полученное с помощью одного типа данных, подтверждается другим. В данном случае мы изучили три источника информации: белковые домены, тРНК и дипептидные последовательности. Все они показывают одинаковую последовательность добавления аминокислот к генетическому коду в определённом порядке».

Ещё одной находкой была двойственность в появлении дипептидных пар. В каждом дипептиде совмещаются две аминокислоты, например, аланин-лейцин (AL), в то время как симметричная пара, анти-дипептид, имеет обратную комбинацию — лейцин-аланин (LA). Два дипептида в паре дополняют друг друга; их можно считать зеркальным отражением друг друга.

«Мы обнаружили нечто замечательное в филогенетическом древе, — говорит Каэтано-Аноллес. — Большинство дипептидов и анти-дипептидов появлялись на эволюционной шкале очень близко друг к другу. Эта синхронность не была ожидаемой. Эта двойственность обнаруживает нечто фундаментальное в отношении генетического кода, с потенциально трансформирующим значением для биологии. Это предполагает, что дипептиды возникали закодированными в комплементарных нитях геномов нуклеиновых кислот, вероятно, минималистичных тРНК, взаимодействовавших с первобытными синтетазными ферментами».

Дипептиды возникли не как произвольные комбинации, но как критически важные структурные элементы, формировавшие свёртывание и функционирование белков. В исследовании предполагается, что дипептиды представляют собой первобытный белковый код, появившийся в ответ на структурные запросы ранних белков, параллельно с ранним операционным кодом на основе РНК. Этот процесс формировался совместной эволюцией, молекулярным редактированием, катализом и специфичностью, в итоге приведя к появлению синтетазных ферментов, современных хранителей генетического кода.

Открытие эволюционных корней генетического кода углубляет наше понимание происхождения жизни и предоставляет информацию таким современным отраслям, как генная инженерия, синтетическая биология и биомедицинские исследования.

«Синтетическая биология признаёт ценность эволюционной точки зрения. Она усиливает генную инженерию, позволяя природе руководить дизайном. Понимание архаики биологических компонентов и процессов важно, поскольку оно подчёркивает их живучесть и устойчивость к переменам. Чтобы вносить осмысленные модификации, крайне важно понимать ограничения и логику, лежащую в основе генетического кода», — говорит Каэтано-Аноллес.

Работа «Отслеживание происхождения генетического кода и термостабильность дипептидных последовательностей в протеомах» опубликована в Journal of Molecular Biology. В числе авторов статьи Минлей Ван, М. Файез Азиз и Густаво Каэтано-Аноллес.

Перевод — Андрей Прокипчук, «XX2 ВЕК». Источники.

Материалы предоставлены Колледжем сельскохозяйственных, потребительских и экологических наук Университета Иллинойса.

Вам также может быть интересно: