Найти тему
lab_mouse

Есть ли у моря гены?

«Прочитан геном четырехрогого чешуйчатого руконога!»

Пожалуй, таким заголовком уже давно никого не удивишь. Разве что биологов, которые об этом руконоге только что услышали - они тут же побегут проверять справочники.

В первые десятилетия после открытия самой возможности секвенирования (чтения) геномов статьи о каждом новом прочитанном живом организме появлялись в научных журналах.

А теперь?
А теперь можно отдать 99 баксов и стать обладателем флэшки с записью себя в строчках из АТГЦ. Ничего особенного.

Но как вам заголовок «Прочитан геном Саргассова моря»?
Геном моря? Автор курил что-то вместе с придумавшим четырехрогого руконога?
А вот и нет!

Предлагаем сегодня поговорить о метагеномике - относительно свежей науке, в которой генетикам без биоинформатиков ну вообще никак.

Как привыкли работать микробиологи и генетики? Брали образец, выращивали его на чашке Петри в питательной среде (культивировали) и потом изучали. Пока вдруг, 20 лет назад, не осознали, что некоторые организмы вырастить почему-то не могут. Только со временем масштаб проблемы стал окончательно ясен: вырастить искусственно можно лишь около 1%(!) от всего разнообразия бектерий! А ведь есть еще вирусы и бактериофаги (вирусы бактерий).

Дело в том, что многие микроорганизмы существуют не "сами по себе", а только в тесном симбиозе с другими видами. То есть чтобы культивировать такую привереду для дальнейшего изучения, придется сначала изучить, с кем из соседей по родине она привыкла пить чай по вечерам, а у кого занимать сахар на утренние блинчики, а потом уж переселять их всей шайкой. Ах да! Ведь для секвенирования эту шайку мы потом снова фиг разделим.

Остается только один вариант - брать всех вместе. Зачерпнуть большой поварешкой и отправить в секвенатор, не спрашивая у каждого попавшегося паспорт с пропиской.

Так например, поступают в моей alma mater - Томском государственном университете, где из автора этого текста воспитывают биоинформатика. Предметом изучения моих преподавателей стало ведро воды, взятой из много лет назад заброшенной шахты. И знали бы вы, сколько открытий вытащили на свет вместе с этим ведром!

В области метагеномики ведется множество исследований. На парочке очень хочу остановиться.

Иллюстрация: notanostra_illustrations
Иллюстрация: notanostra_illustrations

Во-первых, на исследовании легендарного Крейга Вентера. Знаете Илона Маска? Вот Вентер - это Маск от биологии. Его идеи постоянно называют сумасшедшими, а потом они работают. Да и личность он не менее эпичная. Благодаря его работе (и наглому заявлению) грандиозный международный проект "Геном человека" закончили на несколько лет раньше, чем планировали. Но к нему и его главному открытию мы дальше еще вернемся.

Крейг Вентер. Источник: Popular Mechanics
Крейг Вентер. Источник: Popular Mechanics

Итак, Крейг Вентер затеял кругосветную экспедицию, в которой ученые зачерпывали воду из разных океанов и разбирались, что в ней нашлось. А нашлось в одном только Саргасовом море 2000 организмов, из которых 148 совершенно новых видов бактерий! И это был 2003 год, когда технологии стоили дорого и были не так хороши как сейчас (то есть "опознать" могли не всех).

Опубликованную в 2004 в журнале Science работу при желании можно посмотреть тут: [Environmental Genome Shotgun Sequencing of the Sargasso Sea - http://www.cbcb.umd.edu/confcour/CMSC828G-materials/Venter-etal-2004-Science.pdf]

Второе направление, на котором сейчас хочу заострить внимание - это проект изучения метагеномов человека. Наверное, вы не раз слышали, что в нас живут тысячи микроорганизмов. А еще вам могли попадаться заголовки вроде "Микробы внутри, из-за которых мы набираем лишний вес". Так вот это только кусочек айсберга. Каждый из нас на несколько килограмм массы своего тела это микробы. Звучит жутко, да? :)

Мне кажется логичным познакомиться поближе с теми, кто ежедневно путешествует по жизни вместе с нами. И, как показывают некоторые исследования, даже заставляет нас принимать те или иные решения. Уже много лет ученые анализируют метагеномы, обитающие у нас на коже и в кишечнике. Ведется большая работа по этой теме и в России.

Источник: https://medium.com
Источник: https://medium.com

Но остановимся немного на том, как же распознать в луже отдельные "личности".

Вот тут мы рассказывали, как секвенируют геном: берут молекулу ДНК, разрезают на куски, делают много копий каждого куска и потом читают и склеивают обратно в целый (относительно) текст. Как если бы мы взяли том "Войны и мира" и положили в шредер.

-5

Но с метагеномами история чуть другая: вместо одной книги, у нас корзинка шопоголика, скупающего содержимое книжных полок без разбору: тут тебе и томик Тургенева под толстым слоем женских журналов, и собрание Саймака вперемешку с руководством по гаданию на руке и справочником программиста на C#. Кошмар, короче.

И все это мы по прежнему кидаем в шредер, чтобы потом склеить!

У "кинуть в шредер" есть свое официальное название - метод дробовика. Или в оригинале shotgun sequencing. (Не путать с генной пушкой! Она совсем про другое.)

Именно этот революционный метод позволил сократить сроки проекта "Геном человека" на несколько лет. И придумал его как раз Крейг Вентер.

Итак, мы все порубили.

Как теперь опознать, что было откуда, чтобы не приклеить хвост бегемота к носу крокодила?

Сначала стоит понять, сколько и каких вообще организмов хотя бы примерно нам попалось в условное ведро. В этом плане хорошо бы, чтобы у каждого из них был некий небольшой кусочек генетического кода, который одновременно похож между всеми видами, но при этом имеет индивидуальные особенности. И чтобы мы примерно знали, как этот кусочек выглядит, чтобы его найти.
И такой кусочек есть!

У безъядерных (а это и есть наши микроорганизмы) это 16S рибосомальная РНК. Этот фрагмент уникален для каждого организма. То есть оценив, сколько вариантов 16S рРНК мы встретили в пробе, мы поймем, сколько разных организмов выловили. А разложив по кучкам одинаковые 16S рРНК и сопоставив размер получившихся, простите, кучек, можно сказать, какая доля и каких организмов содержится в пробе.

И кроме того, чем больше похожи между собой два кусочка у разных видов, тем ближе эти виды на дереве эволюции друг к другу. То есть прочитав один только фрагмент 16S рРНК, мы примерно поймем, кого ищем - ведь родственники искомого организма нам уже знакомы. Это облегчит сборку его генома в дальнейшем, потому что нам будет куда подглядывать в случае сомнений.

Конечно, обо всех методах, которые используют биоинформатики для сборки метагеномов, мы в рамках этого поста поговорить не сможем. Но затронем еще парочку, чтобы лишний раз напомнить, как важны знания математики.

Один из самых важных параметров при работе с геномом это оценка GC-контента.

Что это такое. Мы помним, что генетический код состоит из четырех букв А, Т, Г и Ц (ATGC), в которых напротив А всегда Т, напротив Ц всегда Г.

-6

Так вот, оказывается, соотношение пар АТ к ГЦ индивидуально для каждого организма. То есть, например, у носорога 46% пар ГЦ против 54% пар АТ, а у синицы 51% ГЦ против 49% АТ. Таким образом, присоединив очередной кусочек, который кажется подходящим на первый взгляд, к уже собранной части генома организма, мы можем посмотреть, не изменилось ли соотношение ГЦ к АТ? Если нет - наверное, прикрепили фрагмент правильно. А если изменилось - скорее всего мы ошиблись и клеим тот самый нос крокодила на хвост носорога.

Кроме оценки GC-контента мы также можем сравнивать распределения четверок нуклеотидов - оно тоже вполне уникально. Или частоты использования каждого из кодонов (кодон - это слово из трех букв) в одноцепочечной молекуле. Видим, что в собранном фрагменте кодон AAC встречается в 26% случаев, а если присоединим новый фрагмент, то станет 28%? Присоединяем неправильно.

В общем говоря, статистика полезная штука.:)
А еще, думаем, после этого поста даже весна с грязными лужами под ногами заиграет для вас новыми красками. Ведь теперь вы знаете, что в каждой луже может быть целое научное открытие!