Найти в Дзене

Запуск парсимониального анализа в TNT. Часть 1.

В прошлых статьях я рассказала про алгоритмы, с помощью которых можно искать самые экономные деревья, точные и эвристические. Если в этой статье какие-то термины будут непонятными, то, скорее всего, они объяснены в тех статьях.

Теперь речь пойдет о программах, в которых их можно запускать. Их всего три: 1) TNT, 2) Nona (ее интерфейс называется Winclada), 3) Paup.

Я расскажу только про TNT и Winclada. Про PAUP не буду рассказывать, по крайней мере, пока. Дело в том, что эта программа сейчас редко используется для кладистического анализа, и она не очень удобная. Впрочем, там есть какие-то обновления, и если в какой-то момент я пойму, что ее недооцениваю, то расскажу и про нее.

Начну с самой популярной программы - это TNT. Описание многих ее функций можно найти в статье Goloboff et al. (2008), хотя за это время некоторые вещи изменились.

По этой ссылке - официальный сайт. Здесь можно TNT скачать, есть версии для Windows, Mac и Linux. TNT часто обновляется, у нее довольно большой функционал, и есть разные скрипты, которые его дополнительно увеличивают. Признаюсь честно, всего функционала этой программы я тоже не знаю, так что расскажу про то, что сама умею. Проблема TNT в том, что она действительно довольно часто обновляются, и иногда те скрипты, которые нормально идут на одной версии, не идут на другой. Или идут, но с какими-то дополнительными танцами, о которых догадаться бывает не так уж и легко.

Набор данных для этого примера взят из моей статьи Namyatova & Cassis (2013).

Для начала вам нужно cоздать или открыть свою матрицу в Mesquite, и сохранить ее в формате .tnt. Как работать с Mesquite описано по этим ссылкам: Часть 1 и Часть 2.

TNT не требует установки, просто надо дважды кликнуть на файл tnt.exe, который будет в папке, который вы скачаете с официального сайта. Откроется вот такое окно.

Чтобы начать работу, надо загрузить файл. Для этого в основном меню надо выбрать File, и в выпадающем окне Open Input File.

-2

После этого будет возможность пройти в нужную вам папку и выбрать требуемый файл.

-3

Если после открытия файла появилось подобное сообщение, то это означает, что все в порядке, файл открылся. TNT считал размеры матрицы, в данном случае у меня 27 терминальных таксонов на 56 признаков.

Прежде чем начать анализ, надо убедиться, что у программы задано достаточно памяти. Для этого надо в основном меню выбрать Settings, и потом Memory.

-4

Вы увидите вот такое окно.

-5

Max trees по умолчанию 100, но нужно изменить до 10000. Дело в том, что когда программа достигнет 100 наиболее экономных деревьев, она остановит анализ. Но нам обычно надо больше. Жмем Ok.

Чтобы убедиться, что с вашей матрицей все в порядке, можно это проверить. В главном меню зайти в Data, и потом выбрать Show Matrix.

-6

Он вам ее покажет вот в таком формате. Как понятно, работать с ней в таком виде не очень удобно.

-7

Для того, чтобы запустить анализ, надо в основном меню выбрать Analyse. Нас пока интересуют три верхние опции.

-8

Implicit enumeration - это branch-and-bound. Traditional search - это обычный обмен ветвей, SPR или TBR. И New Technology Search - это все остальные типы анализов, включая Ratchet.

Давайте начнем с implicit enumeration. Если выбрать ее, то появляется такое окно.

-9

Можно выбрать Collapse trees after search, это означает, то все неподдержанные ветви хотя бы при одном виде оптимизации (об этом обязательно расскажу) схлопнутся, то есть превратятся в политомию. На результаты в целом это не повлияет, потому что неподдержанные ветви все равно не имеют значения. Я обычно ставлю галку в этом месте, но для этого примера не буду ставить.

После того, как анализ запущен, то появляется бегунок, на котором виден прогресс.

-10

У меня всего 27 таксонов и анализ в моем случае закончился довольно быстро. Но если их больше 30, tnt по не очень понятным мне причинам просто может зависнуть.

-11

Это означает, что найдено 1 дерево, и его длина - 144.

Как это дерево увидеть? Идем в основное меню, жмем на Trees, и потом View.

-12

И программа показывает то самое единственное дерево.

-13

Вот что получится, если поставить галку в collapse trees after the search. Как видите, в топологии появились политомии.

-14

В следующей статье мы сравним с тем, что получается, если запустить остальные типы анализов.

Goloboff, P. A., Farris, J. S., & Nixon, K. C. (2008). TNT, a free program for phylogenetic analysis. Cladistics, 24(5), 774-786.

Namyatova, A. A., & Cassis, G. (2013). Systematics, phylogeny and host associations of the Australian endemic monaloniine genus Rayieria Odhiambo (Insecta: Heteroptera: Miridae: Bryocorinae). Invertebrate Systematics, 27(6), 689-726.