В прошлых статьях я рассказала про алгоритмы, с помощью которых можно искать самые экономные деревья, точные и эвристические. Если в этой статье какие-то термины будут непонятными, то, скорее всего, они объяснены в тех статьях.
Теперь речь пойдет о программах, в которых их можно запускать. Их всего три: 1) TNT, 2) Nona (ее интерфейс называется Winclada), 3) Paup.
Я расскажу только про TNT и Winclada. Про PAUP не буду рассказывать, по крайней мере, пока. Дело в том, что эта программа сейчас редко используется для кладистического анализа, и она не очень удобная. Впрочем, там есть какие-то обновления, и если в какой-то момент я пойму, что ее недооцениваю, то расскажу и про нее.
Начну с самой популярной программы - это TNT. Описание многих ее функций можно найти в статье Goloboff et al. (2008), хотя за это время некоторые вещи изменились.
По этой ссылке - официальный сайт. Здесь можно TNT скачать, есть версии для Windows, Mac и Linux. TNT часто обновляется, у нее довольно большой функционал, и есть разные скрипты, которые его дополнительно увеличивают. Признаюсь честно, всего функционала этой программы я тоже не знаю, так что расскажу про то, что сама умею. Проблема TNT в том, что она действительно довольно часто обновляются, и иногда те скрипты, которые нормально идут на одной версии, не идут на другой. Или идут, но с какими-то дополнительными танцами, о которых догадаться бывает не так уж и легко.
Набор данных для этого примера взят из моей статьи Namyatova & Cassis (2013).
Для начала вам нужно cоздать или открыть свою матрицу в Mesquite, и сохранить ее в формате .tnt. Как работать с Mesquite описано по этим ссылкам: Часть 1 и Часть 2.
TNT не требует установки, просто надо дважды кликнуть на файл tnt.exe, который будет в папке, который вы скачаете с официального сайта. Откроется вот такое окно.
Чтобы начать работу, надо загрузить файл. Для этого в основном меню надо выбрать File, и в выпадающем окне Open Input File.
После этого будет возможность пройти в нужную вам папку и выбрать требуемый файл.
Если после открытия файла появилось подобное сообщение, то это означает, что все в порядке, файл открылся. TNT считал размеры матрицы, в данном случае у меня 27 терминальных таксонов на 56 признаков.
Прежде чем начать анализ, надо убедиться, что у программы задано достаточно памяти. Для этого надо в основном меню выбрать Settings, и потом Memory.
Вы увидите вот такое окно.
Max trees по умолчанию 100, но нужно изменить до 10000. Дело в том, что когда программа достигнет 100 наиболее экономных деревьев, она остановит анализ. Но нам обычно надо больше. Жмем Ok.
Чтобы убедиться, что с вашей матрицей все в порядке, можно это проверить. В главном меню зайти в Data, и потом выбрать Show Matrix.
Он вам ее покажет вот в таком формате. Как понятно, работать с ней в таком виде не очень удобно.
Для того, чтобы запустить анализ, надо в основном меню выбрать Analyse. Нас пока интересуют три верхние опции.
Implicit enumeration - это branch-and-bound. Traditional search - это обычный обмен ветвей, SPR или TBR. И New Technology Search - это все остальные типы анализов, включая Ratchet.
Давайте начнем с implicit enumeration. Если выбрать ее, то появляется такое окно.
Можно выбрать Collapse trees after search, это означает, то все неподдержанные ветви хотя бы при одном виде оптимизации (об этом обязательно расскажу) схлопнутся, то есть превратятся в политомию. На результаты в целом это не повлияет, потому что неподдержанные ветви все равно не имеют значения. Я обычно ставлю галку в этом месте, но для этого примера не буду ставить.
После того, как анализ запущен, то появляется бегунок, на котором виден прогресс.
У меня всего 27 таксонов и анализ в моем случае закончился довольно быстро. Но если их больше 30, tnt по не очень понятным мне причинам просто может зависнуть.
Это означает, что найдено 1 дерево, и его длина - 144.
Как это дерево увидеть? Идем в основное меню, жмем на Trees, и потом View.
И программа показывает то самое единственное дерево.
Вот что получится, если поставить галку в collapse trees after the search. Как видите, в топологии появились политомии.
В следующей статье мы сравним с тем, что получается, если запустить остальные типы анализов.
Goloboff, P. A., Farris, J. S., & Nixon, K. C. (2008). TNT, a free program for phylogenetic analysis. Cladistics, 24(5), 774-786.
Namyatova, A. A., & Cassis, G. (2013). Systematics, phylogeny and host associations of the Australian endemic monaloniine genus Rayieria Odhiambo (Insecta: Heteroptera: Miridae: Bryocorinae). Invertebrate Systematics, 27(6), 689-726.