34 подписчика

Карен Прайор "Не рычите на собаку". Краткое содержание

14 мая 202314 мая 2023

15 мин

I. Подкрепление лучше, чем вознаграждение Что такое положительное подкрепление Положительное подкрепление – это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия. Существуют два вида подкрепления: положительное и отрицательное. Положительное подкрепление – это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление – это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук. Поведение, которое уже встречается вне зависимости от того, насколько оно спорадично, всегда можно усилить с помощью положительного подкрепления. Если вы зовете щенка, и он подходит к вам, а вы его ласкаете, то в дальнейшем подход щенка на зов становится все более и более надежным даже безо всякого другого обучения. Простое введение положительного подкрепления за поведение является наиболее элементарной частью этого вида обучения. В качестве подкрепления надо выбирать нечто желаемое субъектом. Для любой

Оглавление

I. Подкрепление лучше, чем вознаграждение
Что такое положительное подкрепление
Отрицательное подкрепление

I. Подкрепление лучше, чем вознаграждение

Что такое положительное подкрепление

Положительное подкрепление – это событие, совпадающее с каким-либо действием и ведущее к увеличению вероятности повторного совершения этого действия. Существуют два вида подкрепления: положительное и отрицательное. Положительное подкрепление – это нечто, желаемое субъектом: пища, ласка или похвала. Негативное подкрепление – это то, чего субъект хотел бы избежать: шлепок, нахмуривание бровей, неприятный звук.

Поведение, которое уже встречается вне зависимости от того, насколько оно спорадично, всегда можно усилить с помощью положительного подкрепления. Если вы зовете щенка, и он подходит к вам, а вы его ласкаете, то в дальнейшем подход щенка на зов становится все более и более надежным даже безо всякого другого обучения. Простое введение положительного подкрепления за поведение является наиболее элементарной частью этого вида обучения. В качестве подкрепления надо выбирать нечто желаемое субъектом. Для любой тренировочной ситуации полезно иметь набор подкреплений.

Отрицательное подкрепление

Это то, что субъект будет стараться избегать. Отрицательные подкрепления имеют градации от слегка неприятных стимулов – едва заметный сквозняк от кондиционера в ресторане, который все-таки заставляет вас перейти за другой столик, – до всевозможных крайностей, например удара электрическим током. Наказание происходит после поведения, на которое оно должно воздействовать. Таким образом, вы не можете избежать наказания, изменив взгляды или поступки, так как неправильное поведение уже осуществилось. Малыш, которого отшлепали за плохой табель успеваемости, может в дальнейшем учиться лучше или хуже, но уже не сможет изменить того табеля, который он уже принес.

Поведение может быть полностью сформировано на основе отрицательного подкрепления, как в большинстве случаев традиционной дрессировки животных: лошадь учится поворачивать налево, когда тянут за левый повод, потому что поворот прекращает неприятное давление; лев вспрыгивает на тумбу, чтобы избежать назойливого хлыста или острой палки, которые держат около его морды.

Время подачи подкрепления

Подкрепление должно совершаться в связи с действием, которое предполагается видоизменить. Подкрепление – это информация. Оно говорит субъекту, что именно вам нравится. Когда субъект пытается обучиться, информационное содержание подкрепления становится важнее самого подкрепления. В тренировке спортсменов или при обучении танцоров именно восклицания инструктора «Да!» или «Хорошо!», отмечающие нужное движение, а не разбор тренировки или репетиции в раздевалке дают требующуюся информацию. Запоздалое подкрепление является наибольшим недочетом начинающего дрессировщика.

Слишком раннее подкрепление тоже неэффективно.

Подкрепление поведения, которое еще не совершилось, – подарками, обещаниями, комплиментами или чем-нибудь в этом роде – ни капельки не подкрепляет это поведение. Если что-то и подкрепляется, так это поведение, совершающееся в данное время: вероятнее всего – выпрашивание подкрепления. Соблюдение времени очень важно и при обучении с отрицательным подкреплением. Лошадь учится поворачивать налево, когда тянут за левый повод, но только если после поворота натяжение ослабевает. Прекращение натяжения является подкреплением. Вы садитесь на лошадь, пришпориваете ее, и она движется вперед – тогда вам надо перестать ее пришпоривать (если, конечно, вы не хотите, чтобы она двигалась быстрее). Начинающие наездники часто тычут лошадь в бока непрерывно, как будто шпоры это своего рода педаль газа в автомобиле, необходимая для движения. Пришпоривание не прекращается и тем самым не несет никакой информации для лошади. Так в школах верховой езды появляются лошади с железными боками, которые передвигаются черепашьим шагом независимо от того, как часто их пришпоривают.

То же происходит и с людьми, к которым постоянно придираются и бранят родители, начальство или учителя. Если отрицательное подкрепление не прекращается в момент достижения желаемых результатов, то оно не является подкреплением и не несет информации. Оно становится как буквально, так и в терминах теории информации «шумом».

Величина подкрепления

Величина каждого подкрепления должна быть чем меньше, тем лучше. Чем меньше подкрепление, тем быстрее животное съест его. Это не только экономит время, но и позволяет дать большее количество подкреплений за один сеанс, прежде чем животное насытиться. подкрепление величиной в один глоток животного вполне достаточно для поддержания его заинтересованности.

Размер подкрепления зависит также от сложности задачи. У людей почти всегда более трудная работа вознаграждается лучше. А если этого нет, то как мы ненавидим тяжелую работу, если нам приходится ее делать.

Большой куш

Одним из наиболее полезных приемов пищевого или какого-либо другого подкрепления для человека и животных является получение куша. Это награда, которая во много, иногда в 10 раз больше обыкновенного подкрепления и являющаяся сюрпризом для субъекта. Примером может являться внезапное корпоративное угощение (фуршет) от руководителя организации или желанный, но совершенно неожиданный подарок для плохо себя ведущего ребёнка.

Условное подкрепление

Условное подкрепление представляет собой какой-либо изначально ничего не значащий сигнал – звук, свет, движение, – который умышленно связывают с подачей подкрепления. Практически дрессировка животных с использованием положительного подкрепления почти всегда должна начинаться с выработки условного подкрепления. Прежде чем начать выработку поведения как такового, пока субъект еще ничего особенного и не делает, вы учите его понимать значимость условного подкрепления, сочетая его с пищей, поглаживанием иди другим истинным подкреплением. Иногда, по крайней мере при работе с животными, вы можете уловить, когда субъект начинает узнавать ваш сигнал, означающий «Хорошо!». Видно, как животное вздрагивает при действии условного подкрепления и начинает искать истинное подкрепление. После выработки условного подкрепления в ваших руках оказывается реальный способ сообщения животному, что в его поведении вас интересует.

Условные подкрепления приобретают чрезвычайную силу. Так как информация «Ты прав» сама по себе представляет ценность, она не обязательно должна сопровождаться первичным подкреплением. Фактически использование пищи, ласки или чего-нибудь в этом роде можно практически свести к нулю, а условное подкрепление будет приносить прекрасные результаты.

Режимы подкрепления

Для того чтобы поддерживать уже выученное поведение на определенном уровне надежности, не только не надо подкреплять его все время, а даже, наоборот, следует прекратить регулярные подкрепления и перейти на эпизодическое использование подкрепления, подаваемого в случайном и непредсказуемом порядке. Это называется вариабельным режимом подкрепления. Он гораздо более эффективен для поддержания поведения, чем постоянный, предсказуемый. На нём основан успех игровых автоматов.

Лишь в одном случае не следует прибегать к вариативному режиму подкрепления, после того как поведение заучено, – это когда оно направлено на решение своего рода головоломки или теста.

Долговременные программы поведения

В дополнение к вариативному режиму подкреплений можно ввести и закрепленный, при котором субъект знает, что он должен работать определенное время или выполнить определенный комплекс поведенческих реакций за каждое подкрепление. Например, подкрепляя каждый шестой прыжок, можно сделать так, что дельфин будет прыгать шесть раз подряд, и вскоре получим стабильные серии из шести прыжков. Трудность работы с фиксированным режимом подкрепления состоит в том, что первые ответы в сериях не подкрепляются и возникает тенденция к уменьшению затрачиваемых на них усилий.

У дельфинов поддержать поведение поможет случайное подкрепление первого или второго прыжка, помимо шестого. У людей, работающих на станках и получающих фиксированные выплаты по определённым дням, могут быть эффективны различные виды прогрессивных оплат или других подкреплений (например, награды), тесно связанные с качеством и количеством продукции и выдаваемые неодновременно с обычным подкреплением. Применяя либо фиксированный, либо вариативный режимы подкрепления можно оттренировать чрезвычайно длинные цепи поведенческих реакций.

Суеверия: случайные подкрепления

В реальной жизни подкрепления возникают на каждом шагу и часто представляют собой лишь случайное стечение обстоятельств. Когда поведение не связано с последующими событиями, но в мозгу субъекта связывается с ними в качестве необходимого условия их осуществления, говорят о суеверном поведении. Пример этого – человек, грызущий карандаш. Если во время экзамена вам случится взять в рот карандаш и тут же вам придет в голову правильный ответ или хорошая мысль, то такое подкрепление может изменить ваше поведение: хорошие мысли пришли, когда грыз карандаш, таким образом, это действие подкрепляется.

Единственный способ избавиться от суеверного поведения – это убедиться, что оно не связано с подкреплением.

II. Процесс выработки: формирование высших форм поведения без принуждения и боли

Выработка состоит в том, чтобы использовать малейшую тенденцию изменений поведения в нужном направлении и шаг за шагом сдвигать ее к поставленной цели.

Десять правил выработки

1. Повышайте критерий небольшими градациями, чтобы у субъекта всегда была реальная возможность выполнить требуемое и получить подкрепление.

2. В конкретный промежуток времени отрабатывайте что-нибудь одно, не пытайтесь формировать поведение по двум критериям одновременно.

3. Прежде чем увеличивать или повышать критерий, пользуйтесь подкреплением текущего уровня ответа, т. е. подкрепляйте любое исполнение данного действия, имеющегося в данный момент.

4. Вводя новый критерий, временно ослабьте старые.

5. Будьте впереди того, кого вы обучаете: полностью планируйте свою программу выработки так, чтобы в случае внезапного успеха обучаемого, вы знали, что следует подкреплять далее.

6. Не меняйте тренеров на «середине реки»; у вас может быть несколько инструкторов на одного обучающегося, но придерживайтесь одной программы выработки на каждый из типов поведения.

7. Если одна процедура выработки не приносит успеха, найдите другую, существует столько же способов добиться нужного поведения, сколько инструкторов, способных их придумать.

8. Не кончайте тренировку, не дав положительного подкрепления, это соответствует наказанию.

9. Если навык ухудшается, «возвратитесь к детскому саду», быстро повторите весь процесс выработки с серией легких подкреплений.

10. Оканчивайте, по возможности, каждую тренировку на высокой ноте и в любом случае останавливайтесь, оставаясь впереди обучаемого.

Ускорение процесса формирования: введение мишеней, подражание, моделирование

Примеры использования мишеней: похлопывание рукой по сидению при приглашении кого-либо сесть рядом; использование флагов гидом, чтобы туристы следовали за ним и не потерялись.

Подражание в природе свойственно некоторым животным и птицам, а также людям. Молодые особи всех видов учатся большинству из того, что они должны знать, наблюдая, а затем копируя поведение старших.

Моделирование (лепка) состоит в том, чтобы заставить обучающегося выполнять пассивно (двигать им как марионеткой) действие, которое должно быть разучено. Игроки в гольф проделывают это, когда обхватывают рукой новичка сзади, берутся за клюшку и делают клюшкой, находящейся в руке обучаемого, нужный замах.

А как насчет того, чтобы формировать свое поведение?

Существуют всевозможные программы изменения собственного поведения: бросаем курить, следим за своим весом и т. д. Большинство этих программ опирается в основном на метод формирования поведения, обычно называемый модификациями поведения, они могут быть или не быть успешными. Трудность состоит в том, что вы должны сами себе давать подкрепление. Но когда вы подкрепляете сами себя, исчезает элемент неожиданности – ученик всегда знает, чего стоит тренер. При этом очень просто сказать: «Черт с ней, с еще одной звездочкой в моей карточке, я лучше выкурю сигарету».

Доказано, что любая программа самовоспитания может служить лишь некоторым людям. Другие могут добиться успеха, только попробовав три или четыре различные программы или после нескольких повторений данного метода. Фактически такие люди могут успешно изменить свою привычку или покончить с пристрастием, но вряд ли это получится с первого раза.

Некоторым может в значительной мере помочь внушение или самовнушение. Наиболее успешным приемом самоподкрепления является постоянная регистрация результатов. Нужно вести регистрацию так, чтобы улучшение было видно сразу.

III. Управление с помощью стимулов

Все, что вызывает какую-либо поведенческую реакцию, называется стимулом. Некоторые стимулы способны вызывать реакции без какого-либо обучения или тренировки: мы вздрагиваем от громкого звука, моргаем от яркого света, нас тянет в кухню, когда до нас доносится аппетитный запах; животные поступают точно так же. Такие звуки, свет и запахи называются безусловными, или первичными, стимулами.

Другие стимулы заучиваются благодаря ассоциации. Сами по себе они могут ничего не значить, но становятся выделяемыми сигналами для поведения; сигналы светофора заставляют нас стоять или идти, мы вскакиваем, чтобы снять трубку зазвонившего телефона, на шумной улице оборачиваемся, услышав свое имя и т. д., и т. д. Ежедневно мы отвечаем на множество выученных сигналов. Они называются условными, или вторичными, стимулами.

Правила управления с помощью стимулов

Для того, чтобы управлять с помощью сигналов, надо сформировать нужное поведение, а затем, когда оно осуществляется, делать так, чтобы оно происходило во время или сразу после какого-либо определенного сигнала. Этот стимул затем становится ключом, или сигналом, поведения.

Полный контроль с помощью стимулов определяется четырьмя условиями, к каждому из которых следует относиться как к самостоятельному разделу тренировочной задачи, самостоятельному пункту программы выработки.

1 Поведение всегда осуществляется сразу после подачи условного стимула (собака садится, "когда ей приказывают).

2. Поведение никогда не возникает в отсутствие стимула (во время занятий или работы собака никогда не садится спонтанно).

3. Поведение никогда не наблюдается в ответ на другие стимулы (если вы говорите: «Лежать!», собака не должна садиться).

4. Никакое другое поведение не возникает в ответ на данный стимул (когда вы говорите. «Сидеть!» собака не должна ложиться или скакать и лизать ваше лицо).

Только когда все четыре условия соблюдаются, собака действительно полностью и окончательно понимает команду «Сидеть!». Теперь вы действительно управляете ею с помощью стимула.

Условным стимулом – выученным сигналом может быть все, абсолютно все, что может быть воспринято. Флаги, свет, слова, прикосновения, вибрация, хлопки пробок шампанского – короче говоря, безразлично, какой сигнал вы используете. Коль скоро субъект может воспринимать его, сигнал может быть использован для вызова выученного поведения.

Интенсивность сигнала и стирание стимулов

Как только стимул заучен, возможно не только получить его перенос, но также постепенно его уменьшать, пока он не станет едва различим, но по-прежнему будет давать те же результаты. Возможен случай, когда вы можете получать результаты при таких слабых сигналах, которые не видны постороннему глазу. Это называется «стирание» стимулов. Например, если сначала вам приходилось выражать недовольство поведением ребёнка какой-то фразой, то потом достаточно посмотреть на него исподлобья.

IV. Отучение: как использовать подкрепление, чтобы избавиться от нежелательного поведения

Восемь способов избавиться от нежелательного вида поведения

Метод 1. «Убить зверя». Это безусловно подействует. Вам никогда больше не придется снова иметь дело с данным поведением у данного субъекта. Примеры: увольнение служащего, развод с супругом, переселение в другую комнату от неряшливого соседа.

Метод 2. Наказание. Предпочитаемо всеми, хотя оно почти никогда не приносит действительной пользы.

Метод 3. Отрицательное подкрепление. Примеры: строгий взгляд, нахмуренные брови, неодобрительное замечание.

Метод 4. Угашение: поведению предоставляется возможность исчезнуть самому по себе. Хорошо работает, например, с ноющими детьми, а также если ребёнка дразнят в школе, он перестаёт на это реагировать, в итоге дразнилки прекращаются, так как нет реакции.

Метод 5. Выработка несовместимого поведения. Этот метод имеет особую значимость для спортсменов и владельцев домашних животных. Отучить собаку лаять и выть по ночам можно обучив её команде лежать (в лежачем состоянии собаки обычно не лают и не воют). Выработка несовместимого поведения очень полезна для исправления собственного поведения, особенно, когда дело касается эмоциональных состоянии, таких, как печаль, беспокойство, чувство одиночества. Некоторые типы поведения совершенно несовместимы с чувством жалости к себе: танцы, хоровое пение, любая интенсивная двигательная активность, даже бег. Вы не можете быть заняты ими и в то же время барахтаться в несчастье.

Метод 6. Добиться, чтобы данное поведение совершалось по сигналу. В последующем вы перестанете давать этот сигнал. Это наиболее изощренный метод, применяемый тренерами дельфинов для того, чтобы избавиться от нежелательного поведения.

Метод 7. «Формирование отсутствия»: подкрепляется все что угодно, кроме нежелательного поведения. Вежливый способ превратить неприятных родственников в приятных.

Метод 8. Смена мотивации. Это основной и самый лучший способ. Например, чтобы избежать нытья и выпрашивания ребёнком вкусностей в магазине, надо как следует его накормить перед выходом из дома. Если у вас или вашего друга имеются затруднения в поведенческом плане, хорошенько подумайте о возможных мотивах этого поведения. Не забывайте возможности таких причин, как голод, болезнь, одиночество или страх. Если есть возможность устранить основополагающую причину и таким способом снять или изменить мотивацию, вы должны это сделать.

Если Вам понравилась статья, пожалуйста, ставьте лайки и подписывайтесь на мой канал.

Записаться на консультацию (стоимость - 1000 рублей) можно по тел.: +79965639782 (WhatsApp)

E-mail: lilya_bodrova@mail.ru