Найти тему

Неполноценность сложности - когда не стоит усложнять нейронками

Почему быстрые и экономные эвристики делают это лучше

Спустя семьдесят лет после того, как лауреат Нобелевской премии Гарри Марковиц разработал современную теорию портфеля, оптимизация средней дисперсии остается ключевым краеугольным камнем методов выбора портфеля и ключевым компонентом статистического инструментария управляющего фондом. Для современных инвесторов, стремящихся минимизировать волатильность и увеличить свою доходность, стандартная комбинация множественной регрессии и оптимизации средней дисперсии-это порядок дня. Сложность обеспечивает комфорт, а зверинец статистических стратегий, разработанных в лучших бизнес-школах мира, предоставляет убежище управляющим фондами, ищущим подтверждения рациональности и логики статистики. Но разве хрустальные шары инвесторов затуманены сложностью?

Введите быструю и экономную эвристику. Несмотря на убедительные расчеты, безошибочные формулы и обоснование общих, но сложных статистических методов, быстрые и экономные эвристики предлагают освежающую альтернативу таким дорогостоящим в вычислительном отношении стратегиям. Быстро, потому что их использование позволяет принимать решения быстро и экономно, потому что решения часто принимаются, игнорируя всю доступную информацию (предикторы), кроме некоторой ее части. Сводя вычисления к простым и прозрачным методам, эвристики могут принимать решения быстрее и с меньшим количеством информации, чем сложные методы.

Эвристика не нова, и хорошо известно, что мы часто полагаемся на нее при принятии решений, что является предполагаемым следствием нашей ограниченной рациональности, то есть нашей ограниченной способности принимать рациональные решения из-за внутренних и ситуационных ограничений. Использование эвристики у людей (и других животных) часто инстинктивно и терпимо как вторая лучшая стратегия, необходимый компромисс между временем и точностью. Однако простые эвристики нашли предсказательный успех в таких областях, как спорт, медицина, финансы и политика. В 2006 году Шейбехенне и Бредер обнаружили, что любители, использующие эвристику распознавания, более успешно предсказывают результаты Уимблдона, чем эксперты, точно так же в 1997 году Грин и Мех обнаружили, что использование быстрых и экономных деревьев врачами в A&E более точно предсказывает сердечные приступы, чем сложные альтернативы.

Нигде споры об использовании эвристики не являются более спорными, чем между работами Гигеренцера, Канемана и Тверского. Здесь предвзятость в принятии решений человеком рассматривается либо как друг, либо как враг, способствующий фактор или значительное иррациональное влияние, смягчаемое только с помощью статистики и логики.

Прежде чем мы продолжим, я вернусь к статистически подкованному инвестору, чтобы ввести знакомую эвристику компромисса: правило 1/N. Известная как эвристика равенства, она может применяться в ситуациях распределения ресурсов, распределяя ресурсы поровну между N вариантами, следовательно, 1/N. Я представил это с пиццей и тарелками на рис. 1. Предположительно, это может показаться иррациональным методом, но рассматривалось в сравнении с 14 альтернативными инвестиционными стратегиями в исследовании DeMigeul et al. с использованием коэффициента Шарпа, который не всегда был лучше, чем 1/N. На самом деле, только средняя дисперсия Марковица преуспела при оценке с использованием 250-летних обучающих данных для 25 активов. Это, однако, не означает, что 1/N должен быть выходом, только то, что существуют среды и обстоятельства, в которых простые эвристики могут превзойти сложные стратегии. Действительно, сам Марковиц полагался на эту простую эвристику для своих собственных инвестиций.

-2

Почему простая эвристика может превзойти более сложные стратегии? Ответ кроется не обязательно в самих эвристиках, но в природе среды, в которой они используются.

Рациональность в ситуациях неопределенности

Неоклассическая экономика опирается на рациональность. В этой парадигме рациональности решения принимаются с учетом всех соответствующих результатов, их последствий и вероятностей. Это знакомый и логичный мир бизнес-школы, мир риска, где будущее определенно, а оптимизация-это король. В мире риска эвристика занимает второе место.

За пределами казино ситуации совершенного знания и уверенности редки. В 1954 году Сэвидж описал этот ситуационный контраст в малых и больших мирах. В малых мирах результаты познаваемы и объяснимы — подумайте о рулетке; в больших мирах будущее неопределенно, и решения должны приниматься, несмотря на информационные ограничения. В "Инцерто" Нассим Николас Талеб назвал применение стратегий принятия решений, разработанных в наших академических лабораториях малого мира, к ситуациям большого мира нелепой ошибкой. Описание невозможности выполнения требований сложных прогнозных стратегий и выделение опасностей, связанных с неизвестными для таких моделей. В больших мирах основа для рационального принятия решений нереализована.

Итак, именно большие миры являются домом для эвристики. Там, где меньшее количество подсказок и меньшее количество данных может привести к лучшим результатам: эвристика не является второстепенной стратегией.

Прогноз: Где Меньше, там больше

Простые эвристики нарушают наши представления о рациональности. Мы видели, по крайней мере в одной ситуации, что что-то более простое может сделать что-то лучше, и что самая сложная стратегия не обязательно является лучшей. Чтобы исследовать это дальше и расширить наше понимание ситуаций, в которых эвристика является предпочтительной стратегией принятия решений, я попытался воспроизвести результаты 1999 года знаменитостей-психологов Гигеренцера и Тодда в их книге "Простые эвристики, которые делают нас умными". Но прежде чем я перейду к этому, имейте в виду несколько условий для эвристического(al) успеха:

эвристика хорошо работает, когда существует большая предсказательная неопределенность;

когда есть много альтернатив и

когда возможностей для обучения мало.

Эти условия приводят не только к успеху простых методов, но и к падению многих сложных. В сложных стратегиях прогнозирующая неопределенность означает, что существует мало возможностей для точных предположений (или, скорее, больше возможностей для неточных), обширные альтернативы означают необходимость оценки большего количества параметров (и при этом создают больше ошибок) и, наконец, меньшее количество возможностей для обучения означает плохое обобщение.

Давайте вкратце рассмотрим сложность модели. Как правило, сложность можно рассматривать как количество свободных параметров в модели; это переменные, которые мы знаем, количественно оцениваем и оцениваем веса в зависимости от их влияния. Сложные модели с большим количеством переменных требуют большего количества оценок, и большее количество оценок создает больше возможностей для ошибок (особенно если данные, которые мы используем, немного большие и шумные). Как следствие, эти модели, как правило, чрезмерно подходят — продукт дилеммы смещения-дисперсии. Если вы не знакомы, вы можете прочитать о компромиссе, который преследует машинное обучение здесь. На данный момент просто знайте, что переоснащение обычно равно плохому прогнозированию, создавая своего рода перевернутую U-образную функцию на рис. 2.Экономные модели выигрывают от их высокого смещения и отсутствия дисперсии, создавая лучшие прогнозы и отсеивая сигнал в шуме.

-3

Скорость, точность и экономичность простых эвристик позволяют создавать надежные стратегии прогнозирования. В этом примере мы рассмотрим надежность четырех стратегий в подборе и прогнозировании численности населения 83 немецких городов на основе девяти бинарных предикторов (рис. 3).

Рассматриваемые стратегии включают множественную регрессию, типичный статистический метод, а также эвристику, которая изучает меньше переменных и ищет меньше подсказок:

Множественная регрессия-самая дорогостоящая с точки зрения вычислений стратегия, мы будем считать, что наша “сложная модель”. Он создает функцию, находя наименьшее квадратное расстояние между точками данных и гиперплоскостью (подумайте: линия).

"Бери лучшее" -это быстрая и экономная эвристика. Он ранжирует сигналы по важности и выбирает лучший (тот, который наиболее успешно различает все остальные) — некомпенсаторную стратегию. АКА одна-веская-причина.

Правило Дауэса, как регрессия, но быстрее. Вместо того, чтобы находить оптимальные веса параметров, он присваивает только +1 или -1. Не экономный.

Минималистский, как взять лучшее,но без первоначального рейтинга. Очень быстро, экономно.

-4

Результаты (оон)удивительны. Регрессия, наиболее исчерпывающий метод, просматривал все сигналы, назначая веса и создавая наилучшее соответствие с точностью 75%. В прогнозировании регрессия оказалась на втором месте, на несколько процентов выше минималистского метода, который выбирал реплику наугад и придерживался ее. Две эвристики: take-the-best и правило Дауэса вышли на первое место с точностью предсказания около 72% для take-the-best. Но что за шум? Регрессия по-прежнему достигает респектабельного 71% в прогнозе.

Стратегии с интенсивными вычислениями стоят дорого, а эвристика получила плохую репутацию за то, что отдает предпочтение времени, а не точности. Эти результаты показывают, что это не всегда так. В некоторых обстоятельствах вы можете делать более точные прогнозы, прилагая меньше усилий. И в тех случаях, когда простые стратегии столь же успешны, как и сложные, имеет смысл сэкономить время (и деньги!).

Еще одним важным фактором окружающей среды, способствующим использованию эвристики, является тот, в котором существует мало возможностей для обучения. В реальном мире на решения людей влияет их опыт, то, что они узнали, влияет на их действия. Действительно, это может означать многое в самых разных ситуациях и часто считается нежелательной предвзятостью и примером ошибочности и ограничений принятия решений человеком, но сейчас давайте рассмотрим возможности обучения как размер нашего набора данных — именно с таким количеством данных мы должны работать, чтобы строить наши модели и делать прогнозы.

Чтобы увидеть, как возможности обучения влияют на точность прогнозирования моделей, я снова попытался воспроизвести результаты Гигеренцера и Тодда, используя те же модели, что и раньше, оценивая их точность по различным размерам обучающих данных (рис. 4).

-5

Опять же, никаких сюрпризов. То, что мы видим здесь, - это меньший эффект, когда более точные решения принимаются с меньшим количеством данных и меньшими вычислениями, а не с большим.

Наша сложная модель проигрывает по крайней мере одной простой эвристике до тех пор, пока обучающие данные не превысят 80% наших доступных данных. Это нереально. В мире риска мы знаем пространство выборки; в мире неопределенности мы знаем очень мало. Именно здесь бережливость эвристики вступает в свои права, и точные решения могут быть приняты быстро и легко с очень ограниченной информацией. Примечательно, что take-the-best (наша эвристика A*) позволяет увеличить производительность прогнозирования только на 6 пунктов при девятикратном увеличении объема доступных данных.

Плохая точность прогнозирования сложных моделей в условиях неопределенности контрастирует с предполагаемым превосходством рациональности в работе таких ученых, как Канеман, которые вели (анти)эвристические дебаты, утверждая, что их предубеждения и бережливость являются продуктом нашей иррациональности и ограниченной системы 1, вместо того, чтобы отстаивать свои косвенные успехи. Конечно, современные вычислительные достижения и исследования в области эвристики позволили количественно оценить и проанализировать стратегии, ранее понимавшиеся только как инстинктивные и наивные. Есть ситуации, в которых сложные стратегии невероятно успешны, и другие, в которых упускание из виду более простой и быстрой реализации эвристики является дорогостоящим, если не потенциально вредным, надзором. Эти ситуации можно лучше понять с помощью концепции экологической рациональности.

Экологическая рациональность

Лучшие решения могут быть приняты с меньшим количеством информации, меньшими ресурсами и меньшим временем. Поскольку большой мир-это реальный мир, эффективность эвристик в условиях неопределенности делает их важными инструментами принятия решений. Но использование эвристик должно использоваться в средах, где они подходят для успешного результата, другими словами, в средах, в которых их использование является экологически рациональным.

Экологическая рациональность может помочь нам решить, лучше ли выбрать сложную статистическую стратегию, чем быструю и экономную, и наоборот. Прекрасно объясненное здесь Луаном, Ребом и Гигеренцером в контексте принятия управленческих решений, их исследование показывает, что эвристика не уступает рациональным стратегиям.

Там, где известны не все последствия, альтернативы и вероятности; учитывая минимальные данные и обширные альтернативы, надежность быстрой и экономной эвристики предлагает экологически рациональный выбор. Примером, с которым нам всем комфортно, является распределение ресурсов, здесь мы видели, что 1/N является экологически рациональным из-за неопределенности прогноза, большого N и отсутствия значимых возможностей для обучения.

Сложные стратегии долго страдают от переоснащения. В ситуациях отбора персонала, распределения ресурсов, экстренной медицины, политики и спортивных прогнозов эвристика является эффективным инструментом принятия решений. Все это ситуации неопределенности, часто маскирующиеся под риск, когда прогнозирование важнее, чем ретроспектива, а в некоторых случаях прозрачность и запоминаемость эвристик помогают человеку принимать решения таким образом, который не имеет себе равных в вычислительно дорогостоящих методах.