Найти в Дзене

Апостериорное взвешивание методом implied weighting в TNT

Суть апостериорного взвешивания и объяснила в предыдущей статье. В implied weighting веса признаков назначаются с помощью коэффициента К. Чем ниже этот коэффициент, тем выше будет разница в весах между признаками, и тем больше будет отличаться взвешенная филогения от невзвешенной. Более подробное (но на мой взгляд, не очень понятное) объяснение есть в книге Китчинга (Kitching 1998).

Я еще хочу напомнить, что в прошлый раз я написала, что взвешивание не рекомендуется использовать для того, чтобы найти более лучшее дерево, также смотрите вот эти статьи Congreve & Lamsdell 2016, O'Reilly et al. 2016. Однако автор метода implied weighting, Pablo Goloboff, считает иначе. Я тут привожу несколько ссылок для тех, кому интересно: Goloboff 1997, Goloboff et al. 2008, Goloboff et al. 2018.

С этим коэффициентом К проблема заключается в том, что не существует способа подобрать его автоматически. Надо самостоятельно ввести значение до анализа, и как его выбирать не знает никто. TNT - это единственная программа, которая запускает анализ с implied weighting, и там по дефолту стоит 3, поэтому чаще всего запускают его с этим значением.

Я поступаю иначе. Для меня суть не в том, чтобы найти лучшее дерево, а чтобы проверить филогению на прочность. В таком случае протестировать стабильность филогении при разных K - это более надежная проверка. Запускаю анализ с несколькими значениями K, например, чаще всего от 3 до 20, и смотрю все топологии. Хотя бы при каких-то К деревья отличаются. В результатах статьи я описываю все, что у меня получилось, и обычно привожу одно дерево, которое встречается чаще вcего, обычно топология перестает меняться при более высоких К > 7.

Теперь давайте посмотрим, как запускать анализ с implied weights в TNT. Для начала надо запустить анализ без взвешивания и сохранить результат. Про запуск анализа читайте здесь: Часть 1 и Часть 2. Про сохранение деревьев читайте здесь.

Затем в главном меню выбираем Settings, и в выпадающем окне Implied weighting.

Появится вот такое окно.

-2

Для запуска анализа со взвешиванием в верхней половине надо выбрать "using implied weights". Во второй половине надо вбить коэффициент К. Как я уже отметила выше, по дефолту он 3. Для данного примера проведу анализ с К от 1 до 10. То есть сейчас я поставлю 1. Жмем ОК.

-3

После этого программа должна написать, что "Implied weigting is ON", то есть анализ теперь будет проводиться с измененными весами. И Weighting Strength is 1.00000, это значение коэффициента К. Теперь запускаем анализ заново, точно также, как запускаем без взвешивания. После каждого анализа деревья надо сохранять.

Давайте посмотрим, что же получилось.

-4

-5

В данном случае, как и ожидалось, при K=1 и 2, топология довольно сильно отличается от невзвешенной. Но начиная с K=3 топология не противоречит невзвешенному дереву. Топологии с К от 4 до 10 идентичны. Таким образом, эта филогения неплохо выдержала проверку на согласованность признаков.

Congreve, C. R., & Lamsdell, J. C. (2016). Implied weighting and its utility in palaeontological datasets: a study using modelled phylogenetic matrices. Palaeontology, 59(3), 447-462.

Goloboff, P. A. (1997). Self‐weighted optimization: tree searches and character state reconstructions under implied transformation costs. Cladistics, 13(3), 225-245.

Goloboff, P. A., Carpenter, J. M., Arias, J. S., & Esquivel, D. R. M. (2008). Weighting against homoplasy improves phylogenetic analysis of morphological data sets. Cladistics, 24(5), 758-773.

Goloboff, P. A., Torres, A., & Arias, J. S. (2018). Weighted parsimony outperforms other methods of phylogenetic inference under models appropriate for morphology. Cladistics, 34(4), 407-437.

O'Reilly, J. E., Puttick, M. N., Parry, L., Tanner, A. R., Tarver, J. E., Fleming, J., ... & Donoghue, P. C. (2016). Bayesian methods outperform parsimony but at the expense of precision in the estimation of phylogeny from discrete morphological data. Biology letters, 12(4), 20160081.