Найти тему
Елена Гусева

Применение машинного обучения в изучении поведения животных

https://yandex.ru/images/search?text=%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE%20%D0%B8%D0%B7%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B8%20%D0%B6%D0%B8%D0%B2%D0%BE%D1%82%D0%BD%D1%8B%D1%85&ncrnd=1588365119870-815440804943746&p=1&pos=64&rpt=simage&img_url=https%3A%2F%2Flevoberezhny.mos.ru%2Fupload%2Fmedialibrary%2F20a%2Fmoskvarium.jpg&rlt_url=https%3A%2F%2Favatars.mds.yandex.net%2Fget-pdb%2F401063%2F898ca483-e33d-4ce2-8bf1-00d27f5dafbc%2Fs1200%3Fwebp%3Dfalse&ogl_url=https%3A%2F%2Flevoberezhny.mos.ru%2Fupload%2Fmedialibrary%2F20a%2Fmoskvarium.jpg
https://yandex.ru/images/search?text=%D0%BC%D0%B0%D1%88%D0%B8%D0%BD%D0%BD%D0%BE%D0%B3%D0%BE%20%D0%B8%D0%B7%D1%83%D1%87%D0%B5%D0%BD%D0%B8%D0%B8%20%D0%B6%D0%B8%D0%B2%D0%BE%D1%82%D0%BD%D1%8B%D1%85&ncrnd=1588365119870-815440804943746&p=1&pos=64&rpt=simage&img_url=https%3A%2F%2Flevoberezhny.mos.ru%2Fupload%2Fmedialibrary%2F20a%2Fmoskvarium.jpg&rlt_url=https%3A%2F%2Favatars.mds.yandex.net%2Fget-pdb%2F401063%2F898ca483-e33d-4ce2-8bf1-00d27f5dafbc%2Fs1200%3Fwebp%3Dfalse&ogl_url=https%3A%2F%2Flevoberezhny.mos.ru%2Fupload%2Fmedialibrary%2F20a%2Fmoskvarium.jpg

Во многих областях исследований поведения животных улучшение нашей способности собирать большие и подробные массивы данных опережает нашу способность их анализировать. Эти разнообразные, сложные и часто высокоразмерные наборы данных демонстрируют нелинейные зависимости и неизвестные взаимодействия по множественным переменным, и могут не соответствовать предположениям многих классических статистических методов.

Область машинного обучения предоставляет методологии, которые идеально подходят для задачи извлечения знаний из этих данных.

С появлением более дешевых технологий зондирования и отслеживания становится доступен беспрецедентный объем данных о поведении животных. Машинное обучение сыграет центральную роль в преобразовании этих данных в научные знания и станет полезным дополнением к аналитическому инструментарию специалиста по поведению животных.

Последние технологические достижения означают, что могут быть собраны большие массивы данных о движении, мелкомасштабном движении, социальных взаимодействиях, вокализациях и физиологических реакциях отдельных животных. И наоборот, логистические трудности сбора реплицированных данных, особенно из диких популяций, означают, что размеры выборки невелики, несмотря на то, что данные по каждой особи могут быть богатыми, с учетом многих сотен (или даже тысяч) факторов. Эти сложные наборы данных, полученные из различных источников, таких как изображения и аудиозаписи, могут не соответствовать предположениям многих классических статистических моделей.

Более того, неизвестные нелинейные зависимости и взаимодействия между множественными переменными делают неясным, какой тип функциональных отношений следует использовать для математического описания таких данных. Таким образом, исследователи поведения животных оказываются в таком положении, когда автоматический сбор подробных наборов данных становится обычным делом, но извлечение из них знаний является сложной задачей, главным образом, из-за отсутствия доступных аналитических инструментов.

Машинное обучение предлагает методы моделирования данных, дополняющие методы классической статистики. В поведении животных подходы машинного обучения могут решать и другие трудноразрешимые задачи, такие как классификация видов, особей, вокализаций или поведения в рамках сложных массивов данных. Это позволяет нам ответить на важные вопросы по целому ряду тем, включая экологию движения, социальную структуру, коллективное поведение, коммуникацию и благосостояние.

Машинное обучение включает в себя набор методологий, которые изучают закономерности в данных, поддающихся прогнозированию.

Машина (алгоритм/модель) повышает свою производительность (точность прогнозирования) при выполнении задачи (например, классификация содержания изображения) на основе опыта (данных).

Цель заключается в том, чтобы модель прогнозирования хорошо обобщала, то есть делала точные прогнозы по ранее невидимым данным. Невозможно «показать» компьютеру все изображения человека (например, различные выражения лица); вместо этого модель использует извлеченные черты для изучения шаблонов, которые лучше всего различают одного человека от другого. Ошибка обобщения или предсказания является мерой того, сколько ранее невидимых образов (известных как набор тестовых данных) алгоритмов правильно тегирует.

Как статистическое моделирование, так и машинное обучение стремятся построить математическое описание, модель данных и лежащего в их основе механизма; таким образом, неизбежно возникает существенное совпадение между ними. Однако исторически они отличаются друг от друга следующим обоснованием. Статистические модели начинаются с предположения о распределении базовых данных (например, Гаусса, Пуассона). Основное внимание уделяется выводам; оценке параметров статистической модели, которые, скорее всего, привели к получению наблюдаемых данных, и обеспечению границ неопределенности для этих оценок.

Для машинного обучения основное внимание, как правило, уделяется прогнозированию; не обязательно предполагая функциональное распределение для данных, определяется модель, которая достигает оптимальной прогностической эффективности. Именно этот подход, свободный от гипотез, делает машинное обучение привлекательным выбором для работы со сложными наборами данных.

В то время как при традиционном статистическом моделировании выдвигается гипотеза (модель), которая затем принимается/отбрасывается в зависимости от того, насколько она согласуется с измеренными наблюдениями, методы машинного обучения изучают эту гипотезу непосредственно из учебного набора данных.

Машинное обучение может решать широкий спектр задач, включая классификацию наблюдений по заранее определенным наборам, группировку данных по группам, которые разделяют основополагающий процесс и регрессию результата, представляющего интерес, в сравнении с множеством факторов и выяснение их содействующего эффекта.

Продолжение следует. https://zen.yandex.ru/media/id/5ea403cd5bba1914159d25fa/primenenie-mashinnogo-obucheniia-v-izuchenii-povedeniia-jivotnyh-prodoljenie-5ebd07e63773f11ee7199e90