Пищевое подкрепление в тренинге

Работа с разными видами мотивации, научные статьи, переводы и практика.

подборка · 6 материалов

5 месяцев назад

Запутанная история «мягких методов» в России.

Многие из конников за пару десятилетий с 2000х годов точно хотя бы один раз слышали о термине «Мягкие методы». Но ввиду множества противоречивой информации даже мы, одни из первых, кто стал это практиковать...

Татьяна Бурдина

6 месяцев назад

Теория обучения Ч5. Ранее я объяснила, как выглядит обучение в рамках Теории Обучения. За основу взята таблица Оперантного обуславливания, основоположником которой стал Скиннер. Эта теория работает как для животных, так и для людей. Хотя казалось бы, противников механистичного тренинга в мире полно. Помимо этого вида обучения, есть еще импринтинг (запечатление) и социальное обучение. И так, сегодня мы поговорим о пищевом подкреплении из той части таблицы, которая за R+, R-. У ряда авторов проскакивает идея о том, что обучение через пищевое подкрепление это про "мягкость". Не знаю, когда и где появился этот миф, но видимо подмена понятий появилась именно потому, что данный метод эффективен там, где работа с давлением и дискомфортом(P+, P-) малоэффективна или неэффективна вовсе. То есть, на контрасте это выглядит действительно гармоничнее. К примеру её часто демонстрируют в зоопарках, где крупным экзотическим животным через барьеры нужно делать инъекции, брать кровь, стричь когти или пилить копыта. То есть, пищевое подкрепление на контрасте действительно выглядит вполне приемлемо и спокойно. Но в основе такого метода лежит удержание подкрепления до достижения хотя бы небольшого результата. Что само по себе очень дискомфортно для животных. В случае, если человек работает с подкреплением неправильно, он формирует сильнейшую фрустрацию, которая в свою очередь приводит к пищевой агрессии. То есть, если вы что-то требуете у животного, и неверно рассчитываете режим подкрепления, то вы здорово раскачиваете лошадь эмоционально и она начинает здорово злиться! Работа с лакомством это настоящее искусство! С давлением все просто, снизили инициативу, отодвинули на дистанцию и стимулируйте себе с разными уровнями давления туда куда нужно. А вот с инициативой и невероятной активностью попробуйте-ка поиграть, любая ваша ошибка будет наказана.❗ Когда с лакомством начинает тренировать человек без опыта, это часто приводит к полному отсутствию дисциплины, суете животного и опасному сближению с человеком, наваливанию, толканию и много других проблем. Это не проблема самого лакомства, а всего лишь следствие неумения тренера сочетать Давление с Поощрением. То есть, отсутствие опыта. И там где нет опыта - лакомство действительно может навредить. Как метод тренинга он уже много десятилетий популярен, несмотря на псевдо-натуральные теории тренинга. Тренеры просто видят, что если все делать правильно, пользы гораздо больше, чем вреда. Это работает также, как и с людьми. Если человека все время нахваливать, ценность похвалы быстро снижается, как и продуктивность. Если же руководитель в целом руководствуется правилом гибкости в поощрении, то и результатов можно ожидать гораздо больше.

Татьяна Бурдина

6 месяцев назад

Теория обучения Ч4. Отвержение в ряде конных школ пищевого подкрепления связано с тем, что они призваны обучать. А обучение всегда должно быть простым и безопасным. Множество уже профессиональных школ работает не ограничивая себя в инструментах и вполне успешно используя все режимы подкреплений, включая и пищевой. Как мы рассматривали ранее, этот вид поощрения настолько же естественный в общении лошадей, как и другие виды взаимодействий. Не менее натуральный и естественный при общении между ними. Дружественные лошади пасутся рядом на одной лужайке, что выгодно обоим. Помимо положительных эмоций это все закрепляется еще и вкусной едой под ногами, с которой никто никого не сгоняет. Но чтобы умело работать с поощрением, нужен большой опыт. Давайте вспомним о мотивации лошади. Она делится на Положительную R+, R- и Стимуляционную Р+, Р-. Со стимуляционной мотивацией работать легче, потому что она формирует избегание лошади какой либо инициативы. Это удобнее при обучении новичков и в целом безопаснее. Безопаснее любому новичку, любого возраста. Это также комфортнее и для тренера, потому что нет лишней суеты, которую может создать ученик при отсутствии опыта работы с Положительной мотивацией. Однако же, как объяснить то, что приличная часть конного мира все таки не отказывается от Положительной мотивации в R+, R-, активно или вариативно* включая ее в работу со Стимуляционной мотивацией Р+, Р-? Дело в том, что если ты учишь лошадь множеству упражнений и нужно, чтобы она охотно и энергично предлагала бы нужное движение, нужен высокий уровень желания вкладываться в процесс. К тому же, если человек имеет опыт работы с поощрением, то результат и быстрее и лучше. У лошади есть желание повторить упражнение и это дает возможность закрепить лучший его вариант. У упражнений также есть переходные формы, которые тоже необходимо закрепить в моменте. И это тоже проще сделать лакомством. Суета и бесконтрольное повторение вообще без проблем убирается вариативным режимом подкрепления, когда лакомства дается только за лучшее исполнение или промежуточный вариант, близкий к нужной модели движения. Конечно же, новички делают ошибки, формируя суету, хаотичное предлагание упражнений, либо это следствие полного отказа от работы со Стимуляционной мотивацией Р+, Р-. В Стимуляционном режиме очень спокойно выравнивается и суета и хаос, где лошадь быстро учится выполнять упражнения и трюки только по команде. Но с гораздо более высокой мотивированностью, чем если бы мы работали всегда только в режиме Р+, Р-. Чтобы понять, в каком режиме вам нужно и полезно работать, нужно понять вашу цель. Если это просто детский прокат или редкие занятия , то можно не особо включать Положительную мотивацию лошадей, так как она попросту будет мешать. Если же это какие-то очень разнообразные сложные занятия, с высоким уровнем требований, то уровень мотивации тоже должен быть высоким. Также, не стоит забывать, что поощрение обычно включают только на стадии обучения. Позже его исключают за ненадобностью, так как лошадь запоминает стимуляционные команды и можно на занятиях практически уже лакомство не выдавать. Многие тренеры попросту лукавят, обвиняя пищевое пощрение во всех бедах в тренинге. На самом деле они просто не умеют работать с Положительной мотивацией правильно и боятся потери контроля над лошадью. А умение гибко работать со всеми режимами мотиваций, своевременно переключаясь между ними, это уже профессиональный уровень. Избегание же такой формы обучения не формирует тренерский профессионализм, оно лишь маскирует пробелы в образовании самих тренеров. А "философия школы" успешно помогает искусно прятать эти тренерские недочеты.

Татьяна Бурдина

6 месяцев назад

Теория обучения Ч3. Когда я ездила в Ростовский заповедник с зоологом Натальей Спасской и Ко, я очень удивилась насколько сильно отличаются семейные группы лошадей по кондициям. Статус жеребца и кобыл, и их ранг очень сильно влиял на различия во внешнем виде лошадей в каждой отдельной Семье. Давайте еще раз вспомним таблицу оперантного обуславливания и наши прошлые заметки о ней (см схему) В американских школах с "натуральным" уклоном считается, что положительное поощрение R+, R- (именно пищевое) никоим образом не касается социального взаимодействия между лошадьми, как вида. Однако же, если все таки повернуть свой взор в сторону природы реальной, то на деле все выглядит вполне естественно. Там, где статус семейной группы выше - открыт доступ к любым ресурсам. Свободному водопою, лучшим пастбищам, местам защиты от ветра и тд. Посмотрите на фотографии ниже, где изображены лошади в один и тот же период сезона, с разницей в несколько дней. Одни лошади холеные, гладкие и блестящие. Это семейная группа была не последней в очереди к водопою. Те же семейные группы, где особи были тощими и неказистыми, шли к водопою последними и им приходилось еще несколько часов ждать, чтобы улучить момент свободной воды. Это следствие их ранга, доступ к ресурсам или ограничен или закрыт. Отсутствие достаточного количества пищи R- это итог социальных перетурбаций между семейными группами. Кобылы, которые следуют за высокоранговой опытной маткой, и охраняются сильным жеребцом, получают больше травы и воды R+. Так ранг влияет на доступ к пищевому поощрению. Его больше. R+ Другая семейная группа или отдельные особи получают ограниченный доступ к ресурсам или и вовсе не получают. Пищевого поощрения меньше. R- Тоже самое может происходить и внутри самой семейной группы. Лошади, которые не способны за себя постоять, получают меньше еды. Их сгоняют Р+ с лучшей травы R-. Иерархия очень даже влияет на доступ и к пище и к общению и даже к сексу. Главная кобыла может отгонять от жеребца кобыл ниже статусом и получать внимание жеребца в большем количестве, что тоже является положительным поощрением. Давайте рассмотрим влияние тренинга в условиях конюшни. Если конюх плохо знает поведение лошадей, очень быстро лошади учатся на него швыряться Р+. Он испуганно отпрыгивает Р- ,снимая давление лошади и кидает ей сено R+. Таким образом очень быстро закрепляется нежелательное поведение лошади в отношении сначала конюха, а потом уже и остальных людей. Если с ними тоже прокатит запугивание. Если в быту человек не будет учить лошадь отходить в момент раздачи сена а попросит ее принять в сторону или отойти Р+, то она или отойдет сама Р-, или быстро научит его отпрыгивать самого Р-. А целью ее будет быстрый доступ к сену и кормам R+. То есть, через систему "Р+, Р-" лошади добиваются любого доступного им поощрения "R+, R-". Точно также работает и отсроченное подкрепление. Когда мы крутим на корде лошадь в режиме "Р+, Р-" и наконец-то отпускаем лошадь, она уходит к кормушке с сеном или убегает на траву R+. Мы поощряем её этим. Либо мы вариативно, в рандомный момент кормим лошадь сухариками, закрепляя к себе положительное отношение (яблочный автомат), и это отлично прокатывает даже на тренировках в режиме "Р+, Р-". У лошади в памяти осталось - от этого человека, то есть от меня, иногда перепадает что-то приятное, ну побуду рядом с привычным взаимодействием. А вдруг она опять покормит? Эффект казино работает на ура даже с людьми. Сегодня дадут сухарик, завтра не дадут. Лошадь всегда в ожидании. Вариативное поощрение + привязанность и привычка к работе в определённом режиме. И ка ни старайся, выходит так, что работает вся таблица, а не только её половина. Конечно, если фанатично заморочиться, и не допускать моментов пищевого подкрепления, перекладывая обязанности по поощрению и кормлению на другого человека, не водить на выпас, не кормить лакомствами вообще никогда, то можно наверное создать иллюзию "настоящих" отношений для самих себя. Однако, вопрос о естественности такого подхода всё равно остается открытым.

Татьяна Бурдина

6 месяцев назад

Теория обучения. Ч2. Конные школы для того, чтобы было проще и безопаснее работать со студентами, формируют четкую систему работы с лошадьми. К примеру Школы Верховой Езды вешают на стендах длинные списки Техники Безопасности. Потому что новички на то и новички, а лошади животные крупные и сильные. А в школах Работы На Земле, то есть в американских системах, придумали располовинить Теорию Обучения строго пополам, чтобы обезопасить студентов от высокомотивированных лошадей. К сожалению, это привело к серьёзным побочным эффектам, таким как отсутствие информированности. Выходцы этих школ стали забывать биологические и физиологические законы обучения. Но хорошо хоть среди конных сообществ все таки есть биологи и зоологи, специалисты по естественному поведению лошадей. Они без лишних эмоций и очень терпеливо объясняют одно и тоже все новым поколениям в своих не очень популярных научных статьях. Ниже схема Теории Обучения. R+, Это положительное поощрение. Еда, вода, социальные взаимодействия, новизна, впечатления, секс, почесушки, семья и тд. R-, это отрицательное поощрение. Лошадь лишается всего выше перечисленного ввиду природных обстоятельств или тренинга. Режим R+R- стимулирует повторять поведение, так как это важно для выживания в дикой природе. Р+ это положительное наказание. Взгляд, скачок, тычки, удары, хлопание кордой, давление рукой, камнем и пальцем, давление недоуздком, удилами, пинок лошади, закладка ушей сородича, лязгание зубов. Р-. это отрицательное наказание Все вышеперечисленное мгновенно прекращается, если поведение удовлетворяет агрессора. Режим Р+Р- стимулирует избегать поведения или ситуаций, так как это важно для выживания в дикой природе. Ряд школ во всём мире разделились на фанатиков "R+,R-" и "Р+,Р-", и с кровавой пеной у рта спорят между собой, что естественней и натуральнее. Но если посмотреть на природу вещей шире, то таблица оперантного обуславливания выглядит вполне естественно и натурально. И конечно же не забываем про такие виды базового обучения, как импринтинг, то есть запечатление у жеребят и обучение через безусловные рефлексы.

Татьяна Бурдина

6 месяцев назад

Теория обучения. Ч1. Я как-то читала книгу Пата Парелли "Партнёрство", и наткнулась на его очень короткий комментарий про лакомства в работе. Так вот, он в совершенно некатегоричной формулировке объяснил, почему они не используют лакомство. Дело в том, что первый уровень обучения Семь игр создан для новичков, неопытных, нулевых. А лакомство является очень мощным стимулом. Посмотрите на схему, которая используется психологами для обозначения Теории Обучения ( это работает и для животных и для людей). На полном круге вы увидите сверху R+ и R-. Это положительное подкрепление. Например, пища, свобода, тактильные ощущения, секс, социальные контакты, похвала. Все, что мотивирует и подкрепляет поведение - это "R+" Если это убрать, то будет "R-". То есть, если ребенок себя плохо вел, он не получит планшет или конфеты. Если Пат Парелли продаст вам мало дисков со своим курсом, он не получит денег на развитие своей школы NH. Или его раскритикуют. То есть, лишат положительного подкрепления "R-" и впаяют Р+(критика) А в его школе "Партнёрство" в "Семь игр". для неофитов оставили только "P+" и "P-". Так в Теории Обучения обозначают "Давление". Неприятное воздействие, как его еще называют. Дискомфорт. Ну к примеру, если на вас в автобусе какая-то бабка хмуро посмотрит, Р+, вам будет неприятно и вы будете искать причину в своем поведении или просто отвернетесь Р-, потому что это для вас неприятно. Так выглядит давление взглядом. Давление бывает разной силы, величины и длительности. Направление взгляда, движение тела в вашу сторону, тактильное воздействие (нажали пальцем, коснулись локтем, наступили на ногу, оттолкнули, ударили) Почему же в 7 играх студентов учат только давить? Это безопаснее для новичков. Когда на вас постоянно давят Р+, ругают вас, толкают, пинают, пихают - вам хочется только отойти подальше и по возможности не шевелиться. Только тогда воздействие уходит Р-. Такие действия делают вас послушными, как делают послушным новобранцев в армии. Муштра не мотивирует, она подавляет. Подавляет инициативу. То, что заставляет лошадей двигаться в системе "P+, Р-" это избегание дискомфорта или боли на начальной стадии обучения. Со временем появляется привычка и двигательные паттерны. А розовым блюром идет привязанность к владельцу, который именно из-за этого впадает в иллюзию "натуральных отношений". Лошадь просто привыкает, и это тоже здорово! К сожалению, чрезвычайно многие путают истинную мотивацию, основанную на "R+, R-" со стимуляционной "Р+, Р-". Но одно не может быть без другого, эти составляющие работают в балансе. Вспомните дни, когда вы хотите идти на работу, предвкушая что-то новое. Особенно если вечером намечается корпоратив. (R+) А когда вы идете туда нЕхотя, как бы из под палки, потому что надо кормить семью. А вы встаете рано, и так хочется спать. Настроение очень плохое. Но вот это НАДО... P+ ( самодисциплина формируется у детей с детства взрослыми людьми, а затем уже взрослые сами себя внутри стимулируют этим самым P+). А иначе премии не будет Р-. Почувствовали разницу? Вот так это чувствуют и животные Обычно это отражается на еще мало обученных животных. Привыкшие уже не так реагируют эмоционально. Так вот, на работу с вечерним корпоративом вы побежите, потому что предвкушаете удовольствие R+. А из под палки, потому что вас побуждает страх снижения карьерного роста, зарплаты и статуса. Тоже самое работает и в натуре, то есть в природных условиях. Табун бежит на новое пастбище очень радостно и быстро. Как и на водопой. Лошади имеют чрезвычайно высокую мотивацию к поску пищи, воды и социального общения. (R+). И ужасно фрустрирует, когда их ресурсов становится меньше (R-). И голод начинает на них давить (P+). Они снимаются с места и идут в длительный поход за новыми пастбищами, пока не найдут их R+. Если не находят, опять травы мало R- и это превращается в голод P+. То есть реальный физический дискомфорт. Это давит на них Р+ и они снова снимаются с места, чтобы уйти от голода и убрать его P-. И вот наконец-то они нашли огромные пастбища R+ и обрели покой на какое-то время.