201 подписчик

Поддержки ветвей в TNT: bootstrap, jackknife, symmetric resampling

9 ноября 20229 ноя 2022

3 мин

О том, какие поддержки бывают, я написала в предыдущей статье. Теперь давайте разберемся, как их посчитать в TNT.

Для этого надо загрузить матрицу также, как описано здесь (не забывайте этап с увеличением памяти).

Начнем со статистических поддержек. Для этих целей предварительно считать филогению не надо. Сразу же идем в главное меню, жмем Analyze и в выпадающем меню выбираем Resamping.

Откроется вот такое окно, где можно выбрать разные виды поддержек.

Начнем с Bootstrap. Тут самая популярная опция - standard. Но можно выбрать и бутстрап с изменением весов признаков. Мы посчитаем просто бутстрап.

В Jackknife можно выставить removal probability, а в Symmetric resampling - change probability. Это можно оставить по умолчанию.

Number of replicates для публикации я всегда выставляю 10000. Однако если матрица большая, то для проверки промежуточных версий я выставляю 1000. Это не только время обсчета, но на 10000 программа чаще виснет.

Search tree with... я выставляю traditional search обычно, точно также как я провожу сам анализ. Однако можете выставить new tech search, ну и если матрица маленькая, то можно использовать implicit enumeration (то есть branch-and-bound).

Также есть опции в Output results as... Можно выбрать absolute frequences или frequency differences (GC). Я так понимаю, что при absolute frequences показываются только ветви, у которых поддержки больше 50%. Выбираем тут, что больше нравится (в принципе, особо не играет значения). Должен появиться бегунок, который показывает статус анализа. Если он не появился, значит, что-то пошло не так. Вероятно, программа зависла.

После того, как анализ закончился, то дерево появляется автоматически. Иногда TNT может не показать дерево сразу же. Тогда для просмотра поддержек вам надо зайти в главном меню в Trees и там выбрать Multiple tags и дальше Show/Save tags.

Я приведу результаты подсчета поддержек на основе матрицы, которую я взяла для примера. Это Bootrstrap supports.

Это Jackknife supports

Это symmetric resampling.

Для каждых поддержек приведены результаты двух анализов с одинаковыми настройками, только в одном в Output results as... выбраны absolute frequences, а в другом - frequency differences. В первом случае выведены только поддержки > 50%, все остальные ветви схлопнуты.

Сохранить поддержки можно только в графическом режиме в .emf формате, как описано тут.

Какие выводы можно из этого сделать.

1) Как видите, поддержки >50% для двух анализов при подсчете одного типа поддержек очень похожи, но часто не идентичны, варьируют в пределах 5%. Дело в том, что модификация матрицы - это вероятностный процесс, и, каждый раз поддержки будут чуть-чуть отличаться. Это нестрашно, потому разница в 1-5% это очень мала. Но, может, стоит все же выбирать frequency differences, чтобы видеть все поддержки, и особенно обращать внимание на те, которые близки к 50%, но не достигают этой границы. Возможно, вы сможете добавить еще признаков, чтобы увеличить поддержку таких клад.

2) Все три типа поддержек отличаются по количеству клад с поддержкой >50%. В Bootrstrap их 8, в Jackknife - 9, а в symmetric resampling аж 12 (базальную кладу мы не считаем, она всегда 100%, просто потому что филогения укоренена и корень по определению противопоставлен всему остальному). При этом клады, у которых поддержка >90% или приближается к этому значению одни и те же, их всего 4. Так что можно сказать, что хорошо поддержанные клады всегда будут таковыми, вне зависимости от типа поддержек. В Symmetric resamling появилось больше клад с поддержкой чуть выше 50%.

Таким образом, имеет смысл посчитать все три типа поддержек и сравнить результаты. В статью можно поместить тоже все поддержки, много места это на займет.