Когда я пишу, что положительное подкрепление — это не метод дрессировки, а лишь один из способов подкрепить желательное поведение, то часто провоцирую дискуссии. Суть дискуссий в том, что запреты и наказания собакам не нужны, они прекрасно выучат все, что нужно за еду и похвалу. Я не раз писала, что такое наказание (то, чего не хочет собака в данный момент) и призывала не демонизировать его, представляя вместо наказания физическое насилие. Но дискуссии все равно рождаются и в них все равно звучит призыв использовать везде и всегда только положительное подкрепление. Что ж, так тоже можно, и это будет работать безотказно. Но есть нюанс. О нем расскажу сегодня на примере собак, дельфинов и людей (метафорических, правда).
В одной из дискуссий речь зашла о книге Карен Прайор «Не рычите на собаку!» Если вы читали книгу, то знаете, что в ней описываются методики обучения, а в качестве иллюстрации госпожа Прайор нередко использует свой опыт работы с морскими млекопитающими в дельфинариях и океанариумах.
А аргумент в дискуссии был такой: даже дельфинов Прайор умудрялась дрессировать только за еду, и ей не понадобилось этих животных ни в чем ограничивать и повышать на них голос. Почему же нам надо собак ограничивать и наказывать, неужели с ними — одомашненными тысячелетия назад — сложнее, чем с морскими млекопитающими, которые не так сильно нуждаются в общении с человеком?
У меня есть ответ на этот вопрос. Настолько длинный, что этот текст будет целиком ему посвящен. Итак, Карен Прайор работала с морскими млекопитающими в условиях их неволи — в океанариумах и дельфинариях. А еще нам известно, что морские млекопитающие и дельфины в частности — социальные существа с настолько высоким интеллектом, что его все еще не удается изучить до конца. А что самое страшное для существа с высоким интеллектом? Пожалуй, депривация. Депривация — это сокращение либо полное лишение возможности удовлетворять основные потребности — психофизиологические либо социальные. Животные, живущие в дельфинариях, как раз и находятся в условиях депривации. Каким бы современным и продуманным ни было устройство дельфинария, в нем не удастся создать условия дикой природы. То есть дельфины не могут там жить с теми, кого они для жизни выбрали, и так, как они привыкли жить на свободе.
К чему я веду? Когда ты находишься в депривации, у тебя есть одно очень сильное желание — избавиться от нее, получить доступ к стимулам, к общению, к интеллектуальным нагрузкам. Вспомним тестовый запуск депривации для людей: самоизоляцию во время ковида. Нам всем тогда было тяжело в четырех стенах без возможности выйти в люди, встретиться с друзьями. Да даже поход в офис виделся как награда. Морские млекопитающие в неволе чувствуют себя примерно так же за исключением моментов, когда с ними занимается тренер. А уж в эти моменты они готовы сделать все, чего от них хотят. Просто потому, что возможность работать — и есть поощрение для них. И превратить возможность работать в награду для дельфинов удалось именно благодаря депривации.
Есть известный британский сериал под названием «Black Mirror» (Черное зеркало). Он посвящен конфликту технологий и этики. Когда я смотрела один из эпизодов этого сериала, я вспомнила дельфинов Прайор, а также некоторых собак, воспитанных якобы только на положительном подкреплении. Я перескажу сюжет, но если захотите посмотреть сами, то запишите себе, что нужно искать 4 эпизод 2 сезона. В этом эпизоде рассказывают о технологии создания цифровых клонов человека для управления системой «Умный дом», по сути — для прислуживания. Кто лучше тебя знает, какие ты любишь завтраки и на какой спектакль тебе нужно купить билет? Только ты сам. Поэтому тебе вживляют чип в мозг, и этот чип записывает информацию о тебе. Записывает настолько подробно, что сам становится твоим цифровым клоном.
Этическая проблема в том, что цифровые клоны не знают, что они ненастоящие. Они считают себя живыми людьми. И естественно, не хотят прислуживать своей копии, готовить ей завтрак и планировать ее календарь.
Но это не беда, потому что создатели технологии придумали занятную штуку: они помещают клона в условия полной депривации, скажем, на полгода. И через полгода клон (который, напомню, считает себя человеком) уже готов на все. Прямо как те дельфины, которых никто не ругает и не принуждает. Если цена за то, чтобы выйти из депривации, — это необходимость работать, так тому и быть. Работа — это хоть какое-то подобие интеллектуальной и социальной нагрузки, которая так нужна развитому мозгу. Как говорят в сериале: «Задача в том, чтобы надломить клона, но не сломать полностью. Если перестараться, у них едет крыша, и их потом продают по дешевке».
У морских млекопитающих иногда тоже едет крыша от депривации. Думаю, вы слышали истории о том, как косатки убивают своих любимых тренеров ни с того ни с сего. Но давайте вспомним, что у нас собачий блог, и вернемся к собакам. Секрет их воспитания только на положительном подкреплении состоит в том же самом. Если выкрутить на максимум цену работы для них, то никакого дополнительного подкрепления вообще не понадобится. Они будут работать только ради того, чтобы работать. Один из способов выкрутить на максимум цену работы — это та же самая родимая депривация.
Ко мне приходили клиенты, которым предыдущие тренеры давали следующие советы: убирайте собаку в клетку на все то время, что вы с ней не занимаетесь, занимайтесь с другой собакой прямо на глазах у своей, пока она сидит в клетке.
И тогда вам не понадобится ничего, кроме ласкового слова и пары сухариков, пес будет очень сильно стараться, чтобы вам угодить. Формально все выглядит именно так, как это описывают сторонники положительного подкрепления как метода дрессировки. Никаких наказаний, никаких бухтений, никакого, боже упаси, физического насилия. Просто работа для собаки становится смыслом жизни, и, конечно, почти любой пес будет пользоваться шансом поработать, только чтобы не возвращаться на это время обратно в изоляцию.
Правда, бывают собаки, выведенные специально для работы с человеком. И у некоторых из них рабочие качества закреплены настолько сильно генетически, что они и без всякой депривации справляются. Но, думаю, среди среднестатистических владельцев собак-компаньонов найдется не слишком много тех, кому повезло завести именно такого пса. Всем остальным псам свойственно мотивироваться не только возможностью поработать. Но и возможностью просто потусить с хозяином, поесть колбасьих попок, погулять, изучая новую информацию.
Не знаю, стоит ли объяснять здесь, что депривация — это крайне негуманный способ добиться чего-нибудь от кого-либо. На мой взгляд, честнее давать собаке обратную связь разного качества, чтобы она понимала, какое поведение приводит к награде, а какое не приветствуется.
Но тут нужен дисклеймер: я ни в коем случае не топлю за воспитание собак посредством наказаний. Но и не отрицаю наказания как способ сообщить собаке, что ее поведение нам не нравится.
Наказание вообще применимо только в том случае, когда собака понимает (то есть хорошо выучила), как этого наказания избежать. Ну и еще раз: наказание — это не физическое насилие, а всего лишь то, чего не хочет в данный момент собака. Чтобы уж наверняка не ввязаться в очередную дискуссию с последователями исключительно положительного подкрепления, выложу в здесь ссылки на свои материалы о наказании, поощрении и о том, как правильно применять то и другое.