Найти тему
m40r / AreaDNA

КАК ИЗМЕРИТЬ ЭКОЛОГИЧЕСКУЮ НИШУ? МОДЕЛИРОВАНИЕ ПРОСТРАНСТВЕННОГО РАСПРОСТРАНЕНИЯ (SDM) ВИДОВ

Экологическая ниша - фундаментальная #концепция биологии, экологии и биогеографии. История этого термина охватывает все последнее столетие, причем за это время было предложено несколько различных определений и соответствующих теорий. Наибольшую популярность приобрела концепция Хатчинсона. Если предложенные до того Гриннелом и Элтоном содержания понятия "экологическая ниша" считают ее, главным образом, атрибутом определенной области пространства (биотопа), то Хатчинсон рассматривает нишу исходно как атрибут популяции (вида). Этот исследователь придал термину дуальность: в его работах экологическая #ниша может быть представлена и как область географической среды, и как часть многомерного пространства экологических факторов; таким образом, ниша Хатчинсона характеризует и совокупность организмов, и среду их обитания. При этом дуализм состоит во взаимном переходе между пространствами. Данный подход оказался более плодотворным в сравнении с предыдущими и открыл возможность дальнейшего теоретического развития [1]. Именно #теория Хатчинсона легла в основу такого типа экологического моделирования, как #модели пространственного распространения (Species distribution models, SDM, ecological niche m#models ). За последние два десятилетия этот метод приобрел огромную популярность в среде биологов, экологов, специалистов по защите окружающей среды, эволюционистов и эпидемиологов. SDM позволяют связать распространение видов живых организмов с условиями среды. Гипотетические #ареалы строятся на основе мест фактического наблюдения (локалитетов) и больших данных, описывающих экологические условия. Реализация моделей SDM основана на алгоритмах машинного обучения (чаще всего максимальной энтропии - Maxent) и предполагает обучение на тренировочной выборке в пространстве экологических факторов с последующим предсказанием на большей тестовой выборке и переходом к географическому пространству. Чаще всего описывающими среду предикторами служат характеристики климата и рельефа. Следует с сожалением отметить, что сейчас в русскоязычной литературе тематика SDM представлена единичными публикациями [2-3].

Данные для моделирования
Данные для моделирования

#машинное обучение с учителем (supervised machine learning, #ML ) в основе SDM предполагает соответствующие технические трудности и ограничения. Среди них - использование (в большинстве случаев) только положительных сигналов (мест фактического нахождения, но не отсутствия - вместо них точки с неопределенностью), скоррелированность многих предикторов-переменных (мультиколлинеарность), снижающая качество моделей и др. [3-4]. В данной работе нами использованы наиболее представленные на полуострове #Крым виды рода боярышник: Crataegus monogyna, C. orientalis, C. meyeri и C. rhipidophylla. Места фактического нахождения получены из базы данных GBIF [5], где для каждого вида есть 50 или более наблюдений. Предикторы, описывающие географическую среду - 19 биоклиматических переменных - взяты из базы данных Worldclim 2.0 [6] для всех рассмотренных локалитетов и 100 случайно выбранных фоновых точек на территории Крыма. Предварительный обзорный анализ данных позволил выявить и удалить те предикторы, которые сильно скоррелированы между собой или малоинформативны. Так, иерархическая кластеризация позволила установить структуру таких многомерных данных, метод главных компонент (PCA) и коэффициент корреляции - направленность и значимость вклада отдельных переменных и то, насколько согласованно между собой они изменяются. Далее на этапе собственно машинного обучения совокупность точек-локалитетов и фоновых точек разделялась на обучающую и тестовую выборку. С использованием алгоритма Random Forest для каждого вида боярышника построены 10 моделей. Их качество оценивалось по площади под кривой ROC. Наилучшая модель каждого вида (максимальная площадь под кривой) использовалась для оценки вклада отдельных переменных в работу классификатора. У разных представителей рода Crataegus предикторы с максимальным вкладом в работу моделей различались, что можно интерпретировать как отражение различий в их экологических нишах. В данной работе на примере крымских боярышников мы показали, как SDM может быть использована для количественного описания экологической ниши биологических видов - через оценку вклада отдельных биоклиматических переменных в работу моделей, предсказывающих ареалы их географического распространения. В дальнейшем следует учесть, что SDM как инструмент точного исследования данной фундаментальной экологической проблемы требует тщательного подбора предикторов (с исключением биологически нерелевантных и неинформативных переменных) и получения моделей с очень высокими показателей качества - это позволяет избежать ситуации, при которой интерпретацию получает шум. Полученную на основе SDM количественную оценку вклада факторов в работу классификаторов следует сравнивать с данными собственно биологии, по возможности валидируя и улучшая результат.

Список использованной литературы

1. Colwell, R. K., & Rangel, T. F. Hutchinson’s duality: The once and future niche. Proceedings of the National Academy of Sciences // 2009 / 106 (Supplement_2), pp. 19651–19658. https://doi.org/10.1073/pnas.0901650106 2. Дудов С. В. Моделирование распространения видов по данным рельефа и дистанционного зондирования на примере сосудистых растений нижнего горного пояса хр. Тукурингра (Зейский заповедник, Амурская область) // Журнал Общей Биологии / 2016. Т. 77, No 2. c. 122–134.
3. Санданов Д. В. Современные подходы к моделированию разнообразия и пространственному распределению видов растений: перспективы их применения в России // Вестн. Том. гос. ун-та. Биология. 2019. No 46. C. 82–114. DOI: 10.17223/19988591/46/5
4. Orlov M., Sheludkov A. Bioclimatic Data Optimization for Spatial Distribution Models // Springer Proceedings in Earth and Environmental Sciences /2019, pp. 86–95 https://doi.org/10.1007/978-3-030-11720-7_13 5. https://www.gbif.org/ru/ 6. https://www.worldclim.org/