Современные большие языковые модели могут с высокой точностью определять место сбора гербарных образцов и тем самым ускорить оцифровку коллекций естественной истории. К такому выводу пришли биологи Университета Северной Каролины в Чапел‑Хилл. Результаты работы опубликованы в журнале Nature Plants. Речь идёт о геопривязке — восстановлении координат по этикетке образца, где указаны исторические описания местности, старые названия деревень или ориентиры вроде «у моста в трёх милях к северу от города». Сейчас это один из самых трудоёмких этапов оцифровки: исследователю приходится вручную сопоставлять текст с картами и справочниками, либо использовать специализированное ПО с обязательной доработкой экспертом. Команда под руководством постдока кафедры биологии Юйяна Се протестировала большие языковые модели на реальных этикетках из коллекций UNC. Алгоритм на основе LLM анализировал текст, сопоставлял его с современными топонимами и предлагал координаты точки сбора. По данным авторов, средняя
ИИ научили «на глаз» определять, где собрали гербарный образец
7 декабря 20257 дек 2025
2 мин