36 подписчиков
Декомпозиция
Decomposition
Декомпозиция - это операция мышления, состоящая в разложении сложного на более просты и мелкие элементы.
Ещё одно определение - так называется общий приём, применяемый при решении проблем, состоящий в разделении проблемы на множество частных проблем и задач, не превосходящих по сложности первичную проблему. Решение данной задачи складывается из объединения решений, тех самых маленьких задач.
Например, в области нейросетей, значение функции вознаграждений простой и широко применимый метод, который может справиться с различными вызовами.
Простыми словами за решенную задачу агент получает вознаграждение, которое часто представляет собой сумму нескольких компонентов. Каждая из них предназначена для кодирования некоторого аспекта желаемого поведения. Агент учит функции ценности для каждого компонента вознаграждения. А любая отдельная из них функция скорее всего будет иметь более простую форму.
Кто такие агенты в данном случае. В среде существуют 2 частицы: еда и агенты. С помощью сенсоров агенты получают информацию о среде. Как только агенты приближается к еде, то тут же ее съедает и она исчезает. В момент поглощения новая еда появляется рандомно в любом месте среды. Цель агентов - собирать еду, а их работа оценивается исходя из количества съеденного.
1 минута
2 марта 2024