Найти в Дзене

Создание контигов в Geneious

До этого я написала, как загружать сырые последовательности в Geneious, и как проверять их качество.

Допустим, последовательности загружены, мы убедились, что это те последовательности, которые нужны. Что делать дальше?

ПЦР мы ставим с двумя праймерами, чтобы последовательность прочиталась с двух цепочек ДНК. В идеале, и на секвенирование надо отдавать с двух праймеров, поскольку если у нас есть две последовательности, которые должны быть комплементарными, то легче контролировать результат. Если у нас две последовательности сильно отличаются, это будет значить, что какая-то из них не совсем верная. Также могут быть ошибки прочтения секвенатором, и если у нас две последовательности на одну пробу, их гораздо легче заметить и исправить, поскольку вероятность того, что одинаковая ошибка прочтения будет в одном и том же месте в комлементарных последовательностях, очень мала.

Контиг нам нужен, чтобы объединить комплементарные последовательности и посмотреть, насколько хорошо они совпадают. Чтобы сделать контиг, нужно выделить две последовательности с обоих праймеров (у меня в данном случае 16SF - это forward, и 16SR - это reverse), нажать на них правой кнопкой мыши и в выпадающем меню выбрать "De Novo Assemble".

Тут я немного поясню. Я знаю, что есть пользователи, которые сразу выравнивают forward и reverse друг на друга (это первая кнопка в выпадающем меню - Pairwise Align), и работают не с контигом, а с выравниванием. В чем разница? Если у вас хорошее качество последовательностей, то вы ее почти не заметите, потому что в таком случае у вас forward и reverse будут совпадать, и оба метода покажут, что обе цепочки полностью комплементарны. Проблемы начинаются, когда качество не идеальное. Если в последовательностях относительно много несовпадений, то контиг сделан не будет, алгоритм выдаст сообщение, что его сделать невозможно. А вот выравнивание будет сделано в любом случае, неважно, насколько последовательности отличаются, и тут вы рискуете в итоге получить какой-то гибрид, который к нужному вам результату будет иметь приблизительное отношение. Даже если качество последовательностей хорошее, выравнивание все равно может сделать ошибки в том, как оно помещает нуклеотиды друг напротив друга (см. ниже).

После того, как была нажата кнопка De Novo Assemble, выпадает вот такое окно

-2

Тут вам нужно свой контиг назвать. Также вы можете выбрать чувствительность (Senstitivity), при которой контиг будет образовываться. Чем выше чувствительность, тем выше качество последовательностей требуется для того, чтобы сформировался контиг. Нажимаем OK, и вот контиг сформировался отдельной последовательностью с данным ему именем. И сама сдвоенная последовательность показана внизу.

-3

Две синие полоски одна над другой означают, что последовательности идеально совпадают. Там, где остается одна из полосок, совпадения уже не такие хорошие. Ну и те места, где синие полоски заканчиваются, можно смело обрезать, потому что, скорее всего, это начало и конец последовательности, где садятся праймеры, и качество всегда плохое. Давайте посмотрим поближе. Для этого надо нажать на значок увеличительного стекла в меню справа.

-4

Вот так выглядит контиг в середине.

-5

Как видно, все нуклеотиды совпадают. Светло-голубая область, которая означает качество прочтения, колеблется, но почти всегда выше пиков, что означает, что качество хорошее. Слева можно увидеть, какая последовательность, какой нити ДНК соответствует. Тут у нас сверху reverse, а снизу - forward.

Вот так выглядит контин слева. Видно, что в нижней последовательности пики становятся неровными и в какой-то момент она обрывается.

-6

Верхняя последовательность уходит дальше влево, но там совсем уже что-то невнятное, и практического смысла для нас не несет.

-7

Тоже самое будет справа, но только теперь верхняя последовательность будет обрываться.

-8

Теперь, давайте сравним, что будет, если нажать не на De Novo Assemble, а Pairwise Align. Для этого одну из последовательностей нам надо будет вручную перевернуть, то есть сделать из нее комплементарную последовательность. Зачем это нужно? Дело в том, что forward и reverse изначально - это две разные последовательности, но комплементарные друг другу. То есть там где в одной из них A, в другой - T, в одной С, в другой - G, и так далее. Когда мы делаем контиг, то программа автоматически переворачивается одну из последовательностей так, чтобы она совпадала с другой. Это для нашего удобства. Алгоритм выравнивания, разумеется, такой опции не имеет.

Для этого надо выделить ту последовательность, которую вы хотите перевернуть. Я выбрала 16S_D1_1_1_16SR. Далее, в основном меню надо выбрать Sequence, и в выпадающем - reverse complement. В названии перевернутой последовательности появится дополнение (reverse).

-9

Потом надо выбрать две парные последовательности и проделать тоже, что было в начале этой статьи, только нажать не De Novo Assemble, а Pairwise Align.

Вот что получается. Поскольку последовательности хорошего качества, то результат контига и выравнивания очень похож.

-10

Однако можно увидеть какое-то количество пропусков как сверху, так и снизу, что является искажением, и может подпортить окончательный результат.

-11

По этой причине я не рекомендую пользоваться функцией выравнивания при первичной обработке последовательностей.

В следующий раз я покажу, как работать с контигами и чистить их.