Найти тему
Черный Альманах

Математика выбора. Часть 2

Настало время закончить математическую часть анализа работы нейросетей. Напомню, что здесь мы прежде всего рассматриваем свойства этих систем анализа с философской, а не с алгоритмической точки зрения. Сейчас мы разберемся с самым сложным типом нейросетей: с множественными входными и выходными данными.

Итак, первое, что бросается в глаза - сколько входных и выходных параметров у такой нейросети. Возможны несколько вариантов: распорядительная нейросеть, у которой больше выходных параметров, чем входных, и аналитическая нейросеть, у которой наоборот. Легко заметить, что вариант, где много входных параметров и один выходной, рассмотренный ранее, является частный случаем аналитического. Вариант, где количество выходных и входных параметров идентично, мы рассматривать не будем, потому что это крайне редкий случай, но для полноты картины назовём его трансформирующей нейросетью.

Пример одной из таких сетей. Как можно заметить, количество входных и выходных параметров не обязано быть идентичным
Пример одной из таких сетей. Как можно заметить, количество входных и выходных параметров не обязано быть идентичным

На картинке выше представлена аналитическая нейросеть: она учитывает 4 параметра и выдаёт значения 3-м. Количество комбинаций вариантов выхода будет 8 (2^3), однако, для оценки адекватности нас больше интересует количество вариантов входных данных. Их будет 16 (2^4). Соответственно, как и ранее, адекватность мы будем рассчитывать для каждого варианта отдельно и складывать, но теперь каждый вариант мы будем описывать количественно, а не в духе "правильно/неправильно". Простейший случай такой оценки - сложение количества оптимальных значений параметров выхода.

Возьмем пример с картинки под буквой в. Реальные выходные значения 1, 1 и 0 сравним с оптимальными, которые будут соответственно 1, 0 и 1. Если оценивать адекватность примитивным способом, то её значение будет 1/3 или 33%. Для такой же ситуации выходные значения 1, 0 и 0 будут адекватны на 2/3 или 66%. Но так ли хороша эта система оценки адекватности?

Может быть, что конкретно вариант (1, 0, 0) фактически является худшим и, соответственно, максимально далеким от оптимального. Может быть, что складывать надо с разными весами: первый параметр важнее остальных, и тогда разница между (1, 1, 0) и (1, 0, 0) будет невелика. Для каждой нейросети нужно индивидуально практически высчитывать иерархию оптимальности каждого отдельного решения, а если у нейросети очень много входных вариантов, то посчитать их точно становится невыполнимой задачей, учитывая постоянные перестройки. Здесь мы приходим к важному выводу: в большинстве случаев адекватность решения невозможно точно оценить численно.

А поскольку большая часть наших взаимных и внутренних оценок - это попытки оценить адекватность собственных или чужих решений, мы мыслим качественно, говоря о том, какое решение хуже или лучше, но не всегда имея возможность уточнить насколько. Количественное мышление, позволяющее строго оценивать происходящее вокруг нас, стоит для мозга слишком дорого, поэтому мы, в первую очередь реагируя на изменения ситуации проводим в основном качественные сравнения. Это объясняет любовь человечества к классификации и делению всё на чёткие группы - с такими оценками намного быстрее и проще работать.

Теперь, когда мы разобрали эту непростую для восприятия, но очень важную для понимания математическую часть, мы можем наконец перейти к механизму веры. В следующей статье я начну разбирать это явление на простейших примерах.