Найти в Дзене

Принцип Питера для игр или ловушка подкрепления.

Имел я намедни любопытную дискуссию. Не стану приводить её тут полностью - ибо там все вопросы вперемешку (механики и определение сложности, билдостроение, конкретные дизайнерские решения итд), но на одном интересном аспекте остановлюсь. Начну, как обычно, несколько издалека. Среди алгоритмов численных методов поиска оптимума есть и метод градиентного спуска. Двигайся в направлении цели (наибольшего роста/уменьшения), если идти стало некуда - ты в цели. Изучают на младших курсах университетов - посему не стану о нём много говорить. Примерно тода же в голову неофитов вбивают простую идею - метод приводит в локальный оптимум, поэтому однозначно верить ему нельзя. Среди алгоритмов личностного роста тоже можно встретить концепцию преодоления максимального препятствия. Не знаю, что там с психологией - но математика говорит, что прийду я в локальный оптимум, что для личности может быть и не так плохо, как для численного метода анализа функции. Теория эволюция говорит, что более приспособлен
Оглавление

Имел я намедни любопытную дискуссию. Не стану приводить её тут полностью - ибо там все вопросы вперемешку (механики и определение сложности, билдостроение, конкретные дизайнерские решения итд), но на одном интересном аспекте остановлюсь. Начну, как обычно, несколько издалека.

Среди алгоритмов численных методов поиска оптимума есть и метод градиентного спуска. Двигайся в направлении цели (наибольшего роста/уменьшения), если идти стало некуда - ты в цели. Изучают на младших курсах университетов - посему не стану о нём много говорить. Примерно тода же в голову неофитов вбивают простую идею - метод приводит в локальный оптимум, поэтому однозначно верить ему нельзя.

Среди алгоритмов личностного роста тоже можно встретить концепцию преодоления максимального препятствия. Не знаю, что там с психологией - но математика говорит, что прийду я в локальный оптимум, что для личности может быть и не так плохо, как для численного метода анализа функции.

Теория эволюция говорит, что более приспособленные особи выживают. И это обычно переносится на поиск оптимума как "чем лучше ты справляешься с проблемами - тем выше ты поднимаешься в иерархии". Абзацы выше говорят, что так можно подняться к локальному максимуму - но тут уже как бы какая разница? Ведь нам обычно нужен именно локальный максимум - то есть то, чего можем достичь лично мы, не так ли (ибо кит, конечно, ест больше планктона, но нам-то что с того)?

Тем более, если мы рассматриваем единую систему, которая работает с минимумом параметров. Ту же про-сцену соревновательных игр. Ты очевидно можешь расти, если ты сильнее своих соперников - это единственное условие. То есть локальный максимум - это максимум глобальный. Так что играй успешно - и достигнешь успеха... Да и вообще, если ты в принципе успешен - это успех. Спасибо, кэп...

...и иди нахрен, ибо это - обман. Потому что мы получили не принцип эволюции, а принцип Питера. Но где подстава? что это вообще такое?

Вершина успеха (она же - точка стабильности) - всегда неудача.

Когда речь идёт о социальных конструкциях, заголовок имеет неприятную особенность быть правдой.
Когда речь идёт о социальных конструкциях, заголовок имеет неприятную особенность быть правдой.

Согласно принципу Питера, субъект, существующий (правки курсивом - корректровка автора под реалии отрасли) в любой конкурентной иерархической системе, повышается в ранге до тех пор, пока не займёт место, на котором он окажется не в состоянии конкурировать с соответствующими оппонентами, то есть окажется некомпетентным. Этот уровень и называется уровнем некомпетентности данного субъекта. На этом месте субъект «застрянет» и будет находиться до тех пор, пока не покинет систему.

Замечание 0 - речь, очевидно, о статистическом характере принципа, ибо, как минимум, у любой иерархической системы есть вершина, находящийся на которой может вполне себе и не достигнуть уровня некомпетентности. Просто таких субъектов в системе статистически ноль. Замечание 1 - этот прицип означает, что локальный максимум - чаще всего и не максимум вовсе (даже с учётом горизонта достижимости). Замечание 2 - претензии Паркинсона к Питеру (кроме субъективности стремления к росту в системе - но и они не всегда работают в нашем контексте) не имеют смысла вне систем с ограниченным фондом оплаты труда.

Время смотреть конкретику...

Человек человеку волк.

То есть, противник не очень сложный, на первые несколько уровней... Шучу (не совсем). Человек - есть мера всех вещей. Ближе к истине, но смысл обычно совсем не тот, что у Протагора.

Начнём с простого - соревновательных рангов. Если вместо рангов для матчмейкинга используется непрерывный рейтинг - это не наш случай. Нам сейчас нужны системы, в которых используется именно ранговое разделение. Ну вот это вот "одержи 10 побед на ранге Неофит - и перейди в ранг Адепт" и ему подобное. Или не просто 10 побед, а на 10 побед больше, чем поражений - не суть важно. Игроку кажется, что рост в ранге демонстрирует его рост как игрока - но нет, он демонстрирует только рост уровня сопротивления. В конечном счёте игрок останавливается на том ранге, где он не выдерживает этого сопротивления (то есть, собственно, на уровне своей некомпетентности). Но хорошо, всё равно же чем лучше играешь - тем более сильное сопротивление можешь преодолеть? Это тоже ж можно обозвать эволюцией?

Не совсем. В ранге повышаются те, кто лучше приспособлен к более низкому рангу. На новом ранге их приспособленность может быть и сильно ниже. И наоборот - оптимальная на ранге стратегия может никогда на него не попасть - поскольку рангом ниже она не столь эффективна. Чтоб иметь аналог эволюции система должна работать наоборот - результаты игры должен влиять на понижение в ранге, а повышение при этом отдаётся на волю случая. Это выравнивает метагейм структурно и делает конкуренцию честнее (в смысле "более информативного результата").

Метагейм и подкрепление.

С объективной стороной, вроде, понятно. Но принцип Питера работает и вне ситуаций пункта выше. Почему? Тут надо немного углубиться - и убрать объективную причину как она проявляется. От общей картины сместить фокус внимания на игрока. Который делает слишком много допущений.

Основное из них - что на следующем ранге сопротивление растёт за счёт того, что там более сильные игроки. Да, и это тоже - но роль различного метагейма куда выше. Нам сейчас это понятно (мы только что об этом говорили) - но игроку изнутри системы до этого порой дойти сложно. Но это опять что-то на объективном. А субъективно это выглядит так - столкнувшись со сложностями, игрок винит свой "скилл" (или реализацию стратегии), а не саму стратегию. Почему? Потому что уровнем ниже стратегия работала хорошо. А если уровнем ниже стратегия работала не очень хорошо - то он начинает смотреть в сторону её смены. Подкрепление как оно есть. Но именно тут игрок и допускает ошибку. Запас возможностей у стратегий разный - и субъективная близость к вершине может не иметь ничего общего с реальным потенциалом.

Понятно, что этот принцип работает и без метагеймовой фильтрации - на чистом усложнении. Если играть становится субъективно "сложнее" (для победы приходится прилагать всё больше усилий), то мы интуивно предполагаем, что приближаемся к максимальной отдаче от применяемой стратегии (то есть к максимальному уровню сопротивления, который этой стратегией можно перебороть). Это очевидно неверно, но психологически подкрепление работает именно так. Потому что ожидается, что форма этой зависимости плюс-минус одна и та же везде. А на деле зависимость отдачи стратегии от скила/усилий может быть принципиально различной по форме. И это ещё фактор везения не принимается во внимание.

На практике.

Главный враг адекватной оценки сложности - минимальный уровень (зачастую не столь даже важно - сложности или персонажа). Потому что для любого игрока со сколь-либо значительным потенциалом этот уровень сопротивления примерно оценивается нулевым вне зависимости от используемой стратегии. Поэтому когда стратегию приходится-таки реально применять, то происходит неизбежный скачок сложности от нуля до "проектных величин". А эти величины не зависят от предела возможностей (точнее, не зависят однозначно) и могут значительно различаться.

Например, околоДнДшные маги и воины (здесь, очевидно, речь не о пвп турнирах). В первом приближении речь можно вести о хрестоматийном и более общем явлении "воины — по прямой, маги — по параболе". Маг в итоге обычно оказывается сильнее, но в начале играть за него сложно. Но, строго говоря, вызвано это обычно особенностями расстановки противников по кривой сложности. Так что нельзя говорить, что маг сильнее на дистанции в целом (если за воина всё-таки можно эту дистанцию пройти целиком). Ведь сюжет всё равно надо проходить весь. А повышение уровня сложности ударит не только по проходимости финальных противников воином, но и по начальным трудностям магов.

Второе приближение поставит разделение в этом споре по линии урон - контроль. Да, урон позволяет получить победу быстрее и проще, но контроль (+ бафы) даёт возможность для этого там, где на одном уроне (+ лечении) не выехать. Это уже по нашей части. С ростом общей сложности субъективная сложность гонок урона растёт в квадрате - ибо растут и хиты, и урон противника. Впрочем, нет гарантии, что при этом и контроль не перестанет работать.

Третье приближение учитывает уже смешаные составы отрядов. Оно ранжирует подходы по объёму рутины и количеству боёв между отдыхами. Да, самодостаточные персонажи с минимальным расходом лимитированных ресурсов играются проще (именно в плане процесса). А зависимые - постоянно требуют саппортов (и более частых пауз). Но тут уже действительно очевидно, что второй случай будет работать "дольше" (в плане роста статов соперника), но "сложнее" (в плане прилагаемых усилий для любой победы).

Впрочем, "цифры, сестра, цифры". Немного терпения. Реальные цифры требуют указания конкретной игры и аналитики в совершенно непотребных объёмах (прохождений на всех сложностях, всеми интересующими стилями и с имитацией всех уровней скила). Поэтому будем брать модельные (с ограничениями на мультиклассинг они будут ниже, с мифическими чертами - выше, не суть). Они могут не вполне соответствовать реальным, но общий принцип возникновения проблемной ситуации покажут.

Рассмотрим роль условного танка и основной для неё параметр - АС. В качестве первой стратегии возьмём типичного самодостаточного доспешного воина. Его наивный билд даст игроку, допустим, 25 АС. Этого хватит для первой сложности, на второй будет условно терпимо, на третьей - не будет работать вообще. Но игрок уже на второй избавится от тривиальных ошибок билда - и получит 29 АС уже на второй сложности. Что протащит ему эту вторую и со скрипом позволит закончить третью. На которой он начнёт билд оптимизировать (с учётом послезнания) - и выжмет уже 33, что приблизит его ещё на один шаг к "невозможной" (до проблемной проходимости на 4). Выстроив пати для поддержки чара, он сможет получить 50 (но лишится при этом самодостаточности) - это в штатном режиме протащит его через сложности 4 и 5, но на 6 игра будет уже мучением (впрочем, процедурно это мучение будет мало отличаться от штаного прохождения уровнем ниже) из-за гипероптимизации под одну роль. На сложности 7 и 8 можно даже не ходить. Тупик.

Теперь зайдём с другой стороны - вместо тяжёлой брони берём лёгкую и качаем ловкость. Наивный билд даст 24 АС, билд без явных ошибок - 28. В плане возможностей пока ничего не меняется, но играть несколько сложнее базово. Оптимизация уже даст резкий рост до 40 АС (из-за отказа от брони в принципе ради магической, что открывает больше возможностей стекать бонусы) - это спокойная проходимость на 4 и муторная на 5. Из приятных бонусов - это всё ещё самодостаточный персонаж, который может не только танковать, но и наносить урон (и в целом более-менее выстроен в начальной парадигме "ловкача", пусть и с мультиклассом в монаха, например). Минус - отказ от самодостаточности даст только ещё +13-15 (а не +17, как выше), но при этом сам отряд будет менее специализирован. То бишь, 6 сложность, скорее всего, пройдётся штатно, а вот 7 - уже с большими проблемами.

Дропаем теперь интуитивность и начинаем тупо стекать бонусы, даже ценой самодостаточности. Наивный билд даёт 20 АС (а то и меньше - ибо без глубоких знаний самой системы прокачки что-то подобное собирается едва ли не случайными выборами) и считается запоротым. Первые правки (говорить про "ошибки" в условиях заведомо оптимизирующего билдостроения несколько неверно - ибо ошибкой будет любое отклонение от оптимума) дадут уже 30 при довольно муторном игровом процессе - это сложность 2-3 ("муторно" и "очень муторно, но не так и сложно"). Оптимизируем умеренно - и вот у нас уже 45-50 почти с любой пати (5-6 сложность примерно с равными трудностями). Оптимизируем наглухо - и имеем около 70 АС. Что пройдёт нам не только 7 сложность, но и 8. Из минусов - начиная с 4 сложности этот билд (даже оптимизированный) всё равно крайне муторно играется.

То есть мы видим, что естественная прогрессия навыка игры позволяет достаточно плохие объективно стратегии дотащить до 5 сложности (из 8) без порождения сомнения в их жизнеспособности. Чтобы последовательно прийти к качественной стратегии, начинать играть нужно минимум со сложности 4 - и набирать скилл на поражениях. Но на этот подвиг способны не все...

Посмотрим другой пример, немеханический (но всё ещё несколько условный). За весь почтенный возраст в соревновательных дисциплинах MtG были сотни разных колод из десятков архетипов. Но нам интересна одна из общих тенденций. Можно играть малоинтерактивной проактивной колодой (сейчас не суть важно какой - бурном, агрой, штормом или чем-то ещё - важно, что играем мы "от себя"). Навык игры при этом где-то на 80-90% будет определяться тем, как хорошо мы знаем свою деку. По мере наработки опыта мы достаточно быстро начнём забирать "свои" матчи. Дальнейший рост скила позволит забирать чаще матчи "близкие". Но в заведомо минусовых мачапах мы выигрывать не сможем - потому что для этого нужно, чтоб оппонент проиграл. В целом успешность любой колоды определяется метагеймом и уровнем сопротивления, но в нашем случае рост скила оппонентов сказывается на результатах только "близкой" категории (падение винрейта "своих" матчей с 80% до 75 не каждая аналитика увидит). Но пока метагейм благоволит (это не то, чтоб редкость) - мы будем выигрывать уверенно и без напряга. Что породит ложную уверенность в силе стратегии - и попытки (обычно безнадёжные) при первых проблемах (читать - при смене метагейма) поднять общий винрейт за счёт "не своих" матчей - но это почти всегда гиблое дело.

Иное дело - стратегии реактивные. Чтоб забирать даже "свои" матчи, нужно понимать, как играет колода оппонента. Предусловие интеракции включает в себя и действия противника - поэтому недостаточно знать только то, что можешь сделать сам. Из-за этого они (и их винрейт) куда чувствительнее к навыку в более широком смысле - с учётом всего метагейма и всех архетипов (по сути, доля "близких" матчей будет выше 50%). Ими сложнее играть в принципе - но при должном навыке (и благоволящем метагейме, это всё ещё первичное условие) можно обыгрывать большее количество архетипов оппонентов. В этом случае навык действиительно конвертируется в винрейт в широком диапазоне (с доминированием роли метагейма противоречия нет - просто широкий диапазон может быть 40-80, а может - 10-50). Но пока этого навыка нет, может создаваться ощущение, что результаты недостаточны/стратегия неэффективна.

Выступление адвоката.

Вообще, всё это хорошо. Но порой следствия этого всего стоит засунуть куда подальше. Например, когда результат нужно выдать здесь и сейчас. Максимально возможный в этих условиях (а не в принципе). До прогрессии, прокачки (скила и/или персонажа), подкрепления и когнитивных искажений в этом случае дела нет. Например, турнир начинается завтра и состоит из 5 матчей. В этом случае, скорее всего (исключения бывают), выгоднее брать ту стратегию, которую умеешь играть ты, а не которая успешно играет в мете. Ибо без навыка её применения велик шанс просто проиграть самому себе.

Аналогично, если нам надо пройти только пятую сложность из восьми - то надо выбирать тот билд, который пройдёт её с наименьшими страданиями/наибольшим фаном - и нет никакого дела до того, что на восьмой он будет нежизнеспособен.

Но это всё ситуации, в которых речь идёт о результате, а е о прогрессе.