Найти в Дзене

Работа с выравниваниями в Geneious. Часть 1.

Для этой статьи я сделала выравнивание из 20 последовательностей. Как делать выравнивания в Geneious я написала в предыдущей статье. Это все один маркер, цитохром оксидаза с субъединица 1, баркодинговый регион. Это все представители одного рода, очень близкие виды. При таком увеличении черным обозначены позиции, где нуклеотиды отличаются. Надо ли что-то с этим делать? На самом деле в зависимости от ваших целей выравнивание можно редактировать по-разному. Давайте посмотрим на выравнивание поближе. Для того, чтобы его приблизить, надо нажать на значок лупы с плюсом. Если нажать один раз, то видим такую картину. Мы уже не можем охватить все позиции одним взглядом, но зато черные места стали по большей части цветными. Цветом обозначаются те места, где есть отличия в нуклеотидах. Если половина последовательностей имеет в конкретной позиции один и тот же нуклеотид, то этот нуклеотид в этой последовательности обозначается серым. Все отличия - цветом. Красный - аденин, синий - цитозин, зел

Для этой статьи я сделала выравнивание из 20 последовательностей. Как делать выравнивания в Geneious я написала в предыдущей статье.

Это все один маркер, цитохром оксидаза с субъединица 1, баркодинговый регион. Это все представители одного рода, очень близкие виды. При таком увеличении черным обозначены позиции, где нуклеотиды отличаются.

Надо ли что-то с этим делать? На самом деле в зависимости от ваших целей выравнивание можно редактировать по-разному. Давайте посмотрим на выравнивание поближе. Для того, чтобы его приблизить, надо нажать на значок лупы с плюсом.

-2

Если нажать один раз, то видим такую картину.

-3

Мы уже не можем охватить все позиции одним взглядом, но зато черные места стали по большей части цветными. Цветом обозначаются те места, где есть отличия в нуклеотидах. Если половина последовательностей имеет в конкретной позиции один и тот же нуклеотид, то этот нуклеотид в этой последовательности обозначается серым. Все отличия - цветом. Красный - аденин, синий - цитозин, зеленый - тимин, желтый - гуанин. Черный остался в тех местах, где точный нуклеотид неизвестен.

Давайте приблизим еще.

-4

На таком увеличении уже можно видеть все подробности.

Теперь посмотрим на начало выравнивания.

-5

Как видно, некоторые последовательности значительно длиннее других. И лучше всего отрезать те позиции, в которых много отсутствующих данных. Обычно отрезают те места, где в более 50% случае данные отсутствуют. К Отсутствующие данные могут повлияет на анализ, особенно если работа идет с близкородственными видами и в выравнивании мало замен, несущих филогенетический сигнал.

Для того, чтобы отрезать участок выранивания, нужно с помощью левой кнопки мыши выделить ненужный кусок.

-6

И просто нажать кнопку Delete.

Появится вот такое окно.

-7

Нужно нажать Allow Editing (разрешить редактировать выравнивание). Либо это можно сделать, нажав на Allow Editing в меню сверху до того, как вы начала редактировать его.

-8

Вот что мы видим теперь. Сбоку у всех последовательностей появились красные значки. Программа поставила аннотации, в которых записано, что последовательности были отредактированы. Эти значки могут быть полезны, если вы хотите, что эта информация хранилась какое-то время. Но мне, например, не удобно работать с последовательностями, когда в них есть дополнительные значки, поэтому аннотации я сразу удаляю.

Для этого надо сохранить результаты. В основном меню нажать на File - Save.

-9

Теперь в меню над выравниванием появилась новая вкладка - Annotation. Аннотации (то есть что, и в какой позиции было отрезано), также показаны сбоку.

-10

Жмем на вкладку Annotation

-11

Вот эти самые аннотации. Чтобы их удалить, то их надо просто выделить левой кнопкой мыши, и нажать Delete.

Возвращаемся во вкладку Alignment view.

Программа попросить сохранить изменения.

-12

Сохраняем. Теперь выравнивание выглядит привычнее.

-13

Его также надо обрезать с другого конца.

-14

Вот так оно будет выглядеть обрезанным.

-15

Теперь сравните с первой картинкой. Да, выравнивание стало на примерно на 150 позиций короче, зато сомнительных позиций стало гораздо меньше.

.