2 подписчика

Современные методы дрессировки. Кликер

В 30-х годах прошлого века, сотрудники лабораторииСкиннерапредложили аналогично работать с собаками, но вместо свистка (собаки часто боятся свистка) предлагалось использовать любой предмет, издающий монотонный сигнал - крышку от бутылки, карманный стэплер или автоматическую ручку. Этот предмет был условно назван кликером. А сама методика -кликер-тренингом.

Только благодаря усилиям Карен Прайор и других тренеров, ставших сторонниками, данный метод распространился по всему миру. Прайор проводила семинары и общалась с сотнями и тысячами инструкторов собак, которые стремились воплотить в жизнь ненасильственную систему обучения, основанную не на наказаниях и принуждении. Ею была написана книга, широко известная российскому читателю как"Не рычите на собаку"- о том, как обучать практически всему и кого угодно, используя принципы обучения с подкреплением. Карен Прайор стала основателем, издателем и генеральным директором"Karen Pryor's Clickertraining (KPCT)", компании, название которой говорит само за себя, и издательского дома"Sunshine Books, Inc.", который специализируется на книгах и видеофильмах поведенческого направления, особенное внимание уделяя, конечно же, методу дрессировки с кликером, науке выработки оперантного условного рефлекса и положительного подкрепления и его онлайновых подразделений. Она также является основателем "TAG teach International", организации, которая учит тренеров использовать принципы основанного на маркерах обучения в различных видах спорта.

Имя Карен Прайор широко известно во всем мире. Ещё в начале своей научной карьеры она привлекла внимание, использовав в практических целях достижения своего отца — основателя школы бихевиоризма Б. Скиннера. Всю свою жизнь Скиннер посвятил экспериментальной работе с животными, изучая механизмы выработки условных рефлексов. Детям знаменитых родителей часто трудно приобрести своё имя, не так-то легко внести вклад в фундаментальную науку. Однако Карен Прайор избрала иной путь, приведший её к успеху. Из замкнутых стен лаборатории она смело бросилась в бескрайний океан практики. Её первой самостоятельной — и очень серьёзной работой — стала работа в океанариуме. Именно здесь, дрессируя дельфинов и касаток, исследовательница применила научный подход, используя свои глубокие знания теории бихевиоризма.

Дрессировка гигантских водных млекопитающих вообще очень сложна технически и в силу особенностей их физиологии, и просто потому, что они обитают в среде, чуждой человеку. Здесь невозможно принуждение — попробуйте-ка отшлёпать непослушную касатку. Заинтересованность в пище также не может быть безотказным инструментом. Нельзя увеличить интерес к пище, ограничив в ней животное, т.к. это его погубит. Дрессировщице пришлось разработать систему сигналов, позволяющую очень чётко показывать животному, какое из его действий правильно и непременно будет подкреплено, пусть и не моментально. Это очень важный момент, животное можно обучить очень сложным трюкам, которые оно проделывает на значительном расстоянии от дрессировщика.

Главным в этой работе явилась моментальная и чёткая подача условного сигнала, который, в свою очередь, изначально был связан с безусловным подкреплением — лакомством. Данный приём был назван Прайор положительным подкреплением. В качестве условного сигнала использовали щелчок металлической пластинки. Было создано специальное приспособление — кликер — компактная, удобная для работы в самых разных условиях коробочка со щёлкающей пластинкой.

Как оказалось, с помощью кликера удобно дрессировать не только дельфинов, но и других, самых разных животных. В результате Прайор стала одной из известнейших дрессировщиц собак в Америке, а в скором времени и в Европе. Согласитесь, дрессировать дельфинов — это уж очень экзотично, зато воспитанную и послушную собаку хотят иметь миллионы владельцев.

В чем же новизна работы с кликером? Ведь всем понятно, что правильную работу собаки надо поощрять, и любой нормальный владелец стремится делать это. Но стремиться и мочь — это совсем не одно и то же. Всегда ли мы умеем показать собаке, что довольны её действиями, всегда ли, и это главное, она понимает нас? Ведь так часто словесное одобрение запаздывает, как много хозяев не умеют хвалить собак в меру и по месту. Один впадает в бурный восторг, на фоне которого собака попросту забывает, что же так обрадовало её двуногого вожака. Другой и вовсе не умеет радоваться, слово «Хорошо» из него будто клещами вытягивают. Третий столь многословно отдаёт команду, что пёс в этом потоке вообще не в состоянии вычленить, чего от него всё-таки хотят.

Щелчок кликера оказывается однозначным сигналом для собаки, что данный элемент её поведения одобряется хозяином и непременно будет вознаграждён. Используя кликер, можно закрепить очень сложные программы действия Как именно сделать это, подробно описано в книге.

Прайор и её последователям, использующим кликер в дрессировке, удаётся легко обучать и совсем маленьких щенков и уже взрослых животных. Прайор — принципиальный противник использования в работе с животными какого-то ни было принуждения. Её практика показывает возможность коррекции достаточно сильных отклонений в поведении и угашения стойких привычек собаки, неприемлемых для её владельца.

Вот здесь, пожалуй, стоит предостеречь читателя. Нет и никогда не будет создано панацеи от всех бед. Обучившись работать с кликером, вы, несомненно, откроете для себя массу возможностей, о которых ранее и не подозревали. Тем не менее если с собакой нет контакта, если вы в душе побаиваетесь собственного питомца, не готовы внимательно наблюдать за его поведением, вряд ли кликер окажется волшебной палочкой, одно мановение которой меняет весь мир. Кликер — это очень удобный инструмент, но работать всё-таки надо самому. Если в поведении собаки есть проблемы, начните с анализа собственных действий, попытайтесь разобраться в своих эмоциях, в особенностях взаимоотношений между людьми, с которыми общается пёс. Тогда вам, скорее всего, удастся найти корни проблем, а кликер поможет их скорректировать.

Одни приёмы отрабатывать легче с помощью кликера, чем привычными для наших дрессировщиков методами, другие — сложнее. Не все нежелательные привычки животного корректируются одинаково легко. Анализируйте поведение собаки, думайте, используйте кликер не только в рутинной работе, но и как элемент обучающих игр. Он, безусловно, будет полезен хендлерам, тем, кто обучает собак по программам обидиенс, аджилити и т.п. видам дрессировки.

За один десятиминутный урок вы легко сможете переложить методы дрессировки собаки при использовании условного подкрепления. Некоторые собаки боятся свистков. Лучшим условным подкреплением для собак является кликер, маленькая коробочка, которая при надавливании на металлическую пластинку издаёт щелчок.

Возьмите с собой кликер и немного лакомства. Разделите лакомство на маленькие кусочки, так чтобы вознаградить собаку пятнадцать-двадцать раз, но не насытить её. Некоторые собаки будут работать за сухой корм, особенно перед кормёжкой, но обычно лучше взять что-то более соблазнительное.

Научите собаку распознавать щелчок кликера, щёлкая и давая лакомство раз пять в различных частях комнаты или сада (чтобы у собаки не появилось мысли, что кликер работает только в одном определённом месте).

Затем щёлкните кликером и помедлите с лакомством несколько секунд. Если вы увидите, что собака напряглась и ждёт лакомство, знайте, что сигнал стал условным подкреплением. Теперь вы можете создавать поведение, мы называем этот процесс «формированием».

Легче всего сформировать поведение под названием «Поймай свой хвост». Конечно, существует столько способов, как добиться этого поведения, сколько придумывают дрессировщики: вы можете повернуть собаку вокруг себя за ошейник, вы можете положить кусочек бекона на кончик хвоста, чтобы собака обернулась вокруг себя, чтобы полизать хвост. Но есть только один способ добиться этого сразу без принуждений.

Прекратите щёлкать кликером и немного подождите. Ваша собака может быть заинтригована и возбуждена, когда вы ничего не делаете. Она может крутиться и даже заскулить или залаять. В тот момент, когда собака движется или поворачивается в нужном вам направлении, щёлкните кликером. Дайте лакомство.

Опять подождите. Не обращайте внимания на все остальные действия собаки, за исключением правильного (не ждите чуда, один поворот головы или один шаг передней лапой в правильном направлении — это всё, что вам нужно). Если «поймали» это поведение, если у вас хорошее чувство времени, за три или четыре подкрепления вы можете добиться, что собака поворачивается в нужном направлении чаще и быстрее.

Теперь вам не нужно подкрепление после первого шага в нужном направлении, но вы должны подкреплять весь поворот в нужном направлении, который состоит из нескольких шагов, возможно, каждую четверть круга, а после того, как собака освоит эти четвертинки круга, обучение полному повороту пойдёт ещё быстрее.

Рис.1. Дрессировка с помощью кликера

Это лучший момент прекратить первый урок: остановка после маленькой победы — вот золотое правило. На следующий день возьмите кликер, кучу лакомств и начните с первого шага, затем сделайте четверть круга, а затем полный круг, вы увидите, что во второй раз все пойдёт намного быстрее.

После обучения повороту на один круг переходите к следующему шагу:

— повороту на два круга, а затем уже к следующему и очень важному шагу

— разнообразию подкрепления

— в одном случае подкрепляйте половину круга, в другом два круга или один или три полных круга, или даже один с четвертью, такой порядок ваших действий заставит собаку быть очень внимательной.

Когда собака поймёт, что от неё требуется, вы можете ввести знак рукой или словесное указание, чтобы собака выполняла этот трюк, только когда её попросят.

Это очень простой трюк, и он не создаст вам имени великого дрессировщика. Существует и другое поведение, в котором вы сможете попрактиковаться, это «обозначение целей», при котором у собаки формируют такое поведение, как прикосновение носом к точке, на которую вы указали. (Дрессировщики морских львов учат своих животных «целиться» в сжатый кулак дрессировщика, затем опуская кулак на землю, или поднимая его в воздух, дрессировщик может заставить льва двигаться в нужном направлении без принуждения.) Целью этих экспериментов не является обучение собаки трюкам, это демонстрация использования условного подкрепления при формировании поведения и того, насколько эффективным может быть этот вид подкрепления.

Зачем нужен кликер? Почему вы не можете, к примеру, использовать голос и слово «Молодец» в качестве условного подкрепления? Основной причиной является то, что вы не сможете сказать «Молодец» именно в те нужные доли секунды, чего вы с лёгкостью достигнете щелчком кликера. С помощью кликера после небольшой практики вы сможете подкреплять совершенно неуловимые движения — всего один шаг лапой в правильном направлении. Похвала — вещь неопределённая, потому что занимает слишком много времени. Щелчок также несёт информацию и для вас. Он учит вас чувству времени, потому что провести грань между слишком ранним и слишком поздним щелчком намного проще, чем между сказанными вслух словами.

Другой трудностью в использовании слов являются наши постоянные разговоры рядом с собаками, и с самими собаками, которые мы ничем не подкрепляем. Для собак очень трудно рассортировать значимые слова от общего шума, который мы производим. Но щелчок кликера сильно отличается от остальных звуков, поэтому его значение так кристально ясно для собак. Вы действительно увидите, насколько точно условно подкрепляемая собака реагирует на трещотку (она наэлектризована, гальванизирована, возбуждена), по сравнению с собакой натренированной на слово «Молодец».

Около 10 лет назад кликер-тренинг сделал свои первые шаги в собаководстве. Кликер-тренинг прочно утвердил свои позиции и используется в служебной, спортивной, домашней, трюковой дрессировке, в подготовке собак-помощников инвалидов по всему миру. Более того – применение кликер-тренинга не ограничивается собаководством, он применим для любых животных..

Перспективы кликер-тренинга – это:

1. Высокая скорость обучения. Основательница метода – Карен Прайор («Не рычите на собаку», «Несущие ветер») – назвала это «феноменом ускоренного обучения». Достигается он за счет возможности поощрять собаку точно в тот момент, когда она делает то, чего мы от нее хотим. Ведь обычно мы поощряем собаку уже после того, как она совершила правильное действие. Пример: Вам надо научить собаку ходить рядом. Обычно для этого вы побуждаете собаку идти рядом, после чего останавливаетесь и даете лакомство (игрушку и т.п.). Получается, что собака получает награду не тогда, когда идеально выполняла команду, а тогда, когда остановилась. И как же ей узнать – в какой именно момент ее действия были ближе всего к идеалу. В кликер-дрессировке вы поощряете собаку не после, а во время движения, четко давая собаке понять – какое ее поведение вас наиболее устраивает. Таким образом, кликер является как бы «переводчиком с человеческого на собачий».

2. Высокая заинтересованность собаки в работе. Это достигается несколькими путями.) Во-первых, базой в кликер-тренинге является развитие в собаке способности концентрировать свое внимание на хозяине. Что касается наших четвероногих друзей, то кликер-тренинг является именно тем средством, с помощью которого мы можем развить их внимание и сконцентрировать это внимание на себе. И это – самая лучшая база для любой дрессировки. Во-вторых, кликер, как мы уже договорились, является «переводчиком с человеческого на собачий», и с помощью этого переводчика собака очень быстро понимает – чего от нее хотят. А когда имеет место полное взаимопонимание – тут и появляется заинтересованность в совместной работе. В-третьих, в кликер-дрессировке инициатива собаки не только не подавляется, но очень ценится. В-четвертых, собака не боится ошибиться, так как мы изначально исключаем всякую возможность ошибки. Дело в том, что в кликер-тренинге команда вводится только после того, как собака разучила нужный навык.В привычной нам системе дрессировки мы даем собаке команду (которая на начальном этапе обучения является для нее неизвестным набором звуков и не несет никакой информации), затем путем наведения или механического воздействия добиваемся выполнения команды, после чего поощряем собаку. Таким образом, мы занимаемся тем, что исправляем ошибочные действия собаки (которые сама она не может осознать как ошибочные, поскольку еще не понимает смысла команды).Пример: Рассмотрим все ту же команду «рядом» – одну из самых необходимых команд для городской собаки. Какой результат мы хотим получить от воздействия этой команды? За исключением мелких индивидуальных нюансов, каждый владелец хочет, чтобы по команде «рядом» его собака занимала положение у его левой ноги и двигалась, сообразно темпу хозяина, не отставая и не забегая вперед, не путаясь под ногами и не шарахаясь в сторону, неопределенно долгое количество времени. Обычные действия владельца – прицепить поводок, произнести команду «рядом» и начать движение, рывками поводка добиваясь от собаки правильного положения у левой ноги и поощряя ее, когда этого положения удается добиться. У этого метода (безусловно, действенного, иначе он не просуществовал бы так долго) есть два больших минуса. Первый – после команды «рядом» собака совершает много неверных движений (что неудивительно – ведь она еще не знает, что такое «рядом»!), зачастую дрессировщик повторяет команду несколько раз, прежде чем собака наконец совершит верные действия и получит награду. Это учит собаку тому, что после первой команды, если она не выполнена, последует вторая, третья и т.д., пока наконец собака ее не выполнит. В реальной жизни собака, не выполняющая команду с первого раза, – это собака, не выполняющая команду. И мало утешения осознавать, что мы сами ее этому научили. Второй минус – собака привыкает ждать коррекции от хозяина. Большое количество собак или даже целых пород получили ярлыки «недрессируемых» только потому, что их владельцы не знали других методов дрессировки, кромемеханического или контрастного. Теперь давайте рассмотрим, как мы будем учить с собакой команду «рядом» методом кликера. Обучение здесь идет поэтапно. На первом этапе собаку поощряют только за то, что она находится около левой ноги (например, вы играете с собакой и, как только она оказывается слева от вас, – следует щелчок кликера и поощрение). Никакой команды на этом этапе мы не вводим. В сущности, собака и не понимает, что ее чему-то учат – она учится сама на собственном опыте, как это и бывает в обычной собачьей жизни. И очень-очень быстро собака делает вывод, что находиться слева от хозяина очень выгодно для нее. Тогда можно начинать движение и поощрять собаку уже только тогда, когда она сделает хотя бы пару шагов рядом с вами. Количество шагов быстро растет, так как собака не замедлит сделать для себя еще один приятный вывод: двигаясь рядом с хозяином, заглядывая ему в глаза, она имеет реальную возможность получить награду. Результат: собака на прогулке регулярно подбегает к вам, занимает положение рядом слева и бежит, «прилипнув» к вашей левой ноге. Разумеется, такое поведение заслуживает награды. И вот тут-то мы и вводим команду «рядом». Заметьте, что, к моменту введения команды, собака уже идеально выучила навык движения рядом, поэтому команда будет выполняться с первого раза и безошибочно.3. Высокая запоминаемость изученных навыков. Секрет прост – собаки, как и мы с вами, лучше запоминают (и охотнее делают) то, до чего додумались сами. А кликер-дрессировка основана на минимальном воздействии на собаку. Механическое воздействие исключается полностью, допускается наведение собаки на нужное действие куском или указкой (таргетом). Но идеальный вариант – это полное отсутствие подсказок со стороны человека. Кстати, это имеет еще один положительный момент – развитие умственных способностей собаки.

4. Для многих собак (а также для очень многих хозяев!) немаловажным является то, что в кликер-дрессировке отсутствует наказание в том виде, в каком мы привыкли его понимать. Неправильное, нежелательное поведение собаки мы игнорируем. Переборщить с похвалой невозможно, но с наказанием очень легко перейти допустимую грань. Неадекватное физическое воздействие порождает проблемы. Воздействуете слишком сильно – рискуете испортить свои взаимоотношения с собакой и привить ей стойкое отвращение к дрессировке. Воздействуете слабо – собака игнорирует ваше наказание или даже воспринимает его как поощрение.

5. Собака легко учится работать на расстоянии от человека (выдержка, команды на расстоянии), так как твердо знает, что свой кусок она получит, и ей нет нужды гипнотизировать хозяйский карман