289 подписчиков

КАК ОБУЧИТЬ НОВУЮ СОБАКУ СТАРЫМ ТРЮКАМ

2 минуты

16 августа

Постоянные расписания подкрепления существуют только в лаборатории, где вознаграждения обычно выдаются в соответствии с компьютерной программой.
Расписания CR не имеют эффективного применения в дрессировке собак.
Во-первых, ни один тренер не обладает возможностями, аналогичными компьютеру, чтобы последовательно награждать собаку за каждый правильный ответ. Во-вторых, при постоянном подкреплении, после начального обучения, реакции собаки в конечном итоге становятся неряшливыми и ненадежными.

Аналогично, другие "фиксированные" расписания подкрепления являются конструкциями академических исследований и, как правило, оказываются неэффективными на практике. Странно, но фиксированные расписания широко используются для обучения людей, где они также являются неэффективными!
Например, при фиксированных интервалах время вознаграждение происходит после фиксированного временного интервала. Основная проблема с "геймовыми вознаграждениями" и "вознаграждениями на день зарплаты" заключается в том, что сотрудники склонны к "лёгкой прогулке", так как знают, что все равно получат оплату независимо от того, работают они или нет.

Также качество работы будет разным. К концу недели, когда приближается пятничная зарплата, все сотрудники работают интенсивно. В понедельник утром это не так!

Аналогично с испорченными собаками: не редкость потерять внимание и участие собаки сразу после получения лакомства. Фиксированные коэффициенты, например, оплата за штуку, когда вознаграждение происходит после фиксированного числа ответов, вызывают "напряжение от соотношения" и проблемы с "контролем качества". Если количество ответов (штук), необходимых для получения вознаграждения (оплата за единицу), слишком велико, субъект сдается и начинает "забастовку". Если субъект работает быстро, чтобы выполнить много ответов (производить больше штук), чтобы заработать больше вознаграждений (больше денег), качество индивидуальных ответов резко падает.

Вознаграждение собаки по переменному расписанию подкрепления, например, с использованием переменного соотношения и/или переменных интервалов, гораздо эффективнее, чем вознаграждение собаки за каждый правильный ответ.
Используя переменное расписание с соотношением, собака вознаграждается за выполнение среднего числа правильных ответов.
Например, вознаграждая собаку после трех правильных изменений положения тела, затем после шести изменений, затем после двух и затем после девяти, собака в среднем получает вознаграждение после каждых пяти правильных ответов (VR5) и фактически получила четыре вознаграждения за 20 правильных ответов.
Аналогично, используя переменное расписание интервалов и награждая собаку, например, после трех секунд сидения, затем через 12 секунд, затем через пять секунд и затем через 20, собака в среднем вознаграждается после каждых 10 секунд сидения (VR10) и получила четыре вознаграждения за 40 секунд накопительного сидения.

ПРОДОЛЖЕНИЕ ЗАВТРА

С подпиской рекламы не будет

Подключите Дзен Про за 159 ₽ в месяц