Добавить в корзинуПозвонить
Найти в Дзене

Поддержки Bootstrap и Jackknife в Winclada (Nona)

Раннее я написала про то, как считать поддержки в TNT: статистические и поддержки Бремера. С помощью Nona и Winclada тоже можно посчитать поддержки, но только Bootstrap и Jackknife. Как и в TNT, для этого не надо проводить филогенетический анализ до подсчета поддержек. Можно открыть матрицу, и сразу же их считать. Чтобы посчитать поддержки, надо в главном меню нажать на Analyze, и в выпадающем меню Bootstrap/Jackknife/CR with Nona. Появится вот такое окно Как видно, что тут есть не только Bootstrap и Jackknife, но и какой-то Char Removal. Я, признаюсь, что не знаю, что это такое и никогда не видела, чтобы его где-то публиковали в качестве поддержек, поэтому я его не делаю. Ключевых параметра тут два. Первый - Number of replications, он определяет сколько раз будет перестроена матрица. Второй = Number of search replications, он определяет сколько раз у нас будет проводится поиск по каждой матрице. Очевидно, что меньше 1000 лучше не задавать ни там, ни там. В случае количества перест

Раннее я написала про то, как считать поддержки в TNT: статистические и поддержки Бремера.

С помощью Nona и Winclada тоже можно посчитать поддержки, но только Bootstrap и Jackknife.

Как и в TNT, для этого не надо проводить филогенетический анализ до подсчета поддержек. Можно открыть матрицу, и сразу же их считать.

Чтобы посчитать поддержки, надо в главном меню нажать на Analyze, и в выпадающем меню Bootstrap/Jackknife/CR with Nona.

Появится вот такое окно

-2

Как видно, что тут есть не только Bootstrap и Jackknife, но и какой-то Char Removal. Я, признаюсь, что не знаю, что это такое и никогда не видела, чтобы его где-то публиковали в качестве поддержек, поэтому я его не делаю.

Ключевых параметра тут два. Первый - Number of replications, он определяет сколько раз будет перестроена матрица. Второй = Number of search replications, он определяет сколько раз у нас будет проводится поиск по каждой матрице. Очевидно, что меньше 1000 лучше не задавать ни там, ни там. В случае количества перестроек матриц (Number of replications), нам все же надо иметь репрезентативную выборку псевдоматриц, чтобы на ее основе посчитать процент появляющихся ветвей в результате их обсчета. Если, например, таких псевдоматриц у нас всего 10, то тут процесс слишком зависит от случайности. 100 уже лучше, но все равно, маловато.

То же самое с количеством репликаций для обсчета этих матриц (Number of search replications). Если у нас их всего 10, то вероятность того, что найдутся не все равноэкономные деревья очень велик, 100 уже лучше, но все равно маловато.

Однако получается, что если у нас количество репликаций и там, и там по 1000, то в итоге он будет включать всего 1000X1000, то есть 1000000 (1 миллион) обсчетов, и поиск будет идти довольно долго, пару часов как минимум.

Если вы хотите предварительно подсчитать поддержки, то можно задать 100 репликаций для обсчета матриц. В этом случае хорошо поддержанные клады все равно будут иметь высокие поддержки.

Для этого примера я задала по 1000 в оба окна (Number of replications и Number of search replications). После этого я нажала Bootstrap. Когда анализ закончился и появились поддежки (как на картинке ниже), я сохранила результат. Потом опять открыла то же окно, задала такие же настройки и нажала Jackknife. Оба раза я ждала примерно 3 часа, пока анализ завершится.

Вот что у меня получилось при обсчете Bootstrap и Jackknife при параметрах 1000X1000. Показаны только клады с поддержкой более 50%.

-3

Поддержки отличаются очень слабо. В обоих случаях есть клады, которые поддержаны >50%, тогда как в результате другого анализа эти клады отсутствуют, очевидно, с поддержками менее 50%. Но если анализы перезапустить с точно такими же настройками, результаты тоже могут слегка отличаться.

В обоих случаях больше ветвей с поддержкой >50%, чем в таких же анализах в TNT, и вообще поддержки немного выше во многих случаях. Возможно, это связано с тем, что Nona делает обсчет более тщательно. В TNT же даже с теми настройками, что я там использую, программа виснет примерно через раз, и чем больше репликаций, тем чаще она будет зависать при подсчете результата.

Еще одна важная вещь. Nona создает вспомогательные файлы в той папке, где у вас находится матрица, иногда их очень много. К примеру, для Jackknife они выглядят вот так.

-4

Если эти файлы присутствуют в папке, где расположена матрица, то анализ очень быстро застопорится. То есть, если вы хотите перезапустить Bootstrap или Jackknife с другими настройками или по другим причинам, то все рабочие файлы Nona надо обязательно удалить до начала анализа. Вообще лучше всего положить файл с матрицей для Winclada (None) в отдельную папку, и периодически удалять оттуда все файлы, кроме матрицы.