Настало время закончить математическую часть анализа работы нейросетей. Напомню, что здесь мы прежде всего рассматриваем свойства этих систем анализа с философской, а не с алгоритмической точки зрения. Сейчас мы разберемся с самым сложным типом нейросетей: с множественными входными и выходными данными.
Итак, первое, что бросается в глаза - сколько входных и выходных параметров у такой нейросети. Возможны несколько вариантов: распорядительная нейросеть, у которой больше выходных параметров, чем входных, и аналитическая нейросеть, у которой наоборот. Легко заметить, что вариант, где много входных параметров и один выходной, рассмотренный ранее, является частный случаем аналитического. Вариант, где количество выходных и входных параметров идентично, мы рассматривать не будем, потому что это крайне редкий случай, но для полноты картины назовём его трансформирующей нейросетью.
На картинке выше представлена аналитическая нейросеть: она учитывает 4 параметра и выдаёт значения 3-м. Количество комбинаций вариантов выхода будет 8 (2^3), однако, для оценки адекватности нас больше интересует количество вариантов входных данных. Их будет 16 (2^4). Соответственно, как и ранее, адекватность мы будем рассчитывать для каждого варианта отдельно и складывать, но теперь каждый вариант мы будем описывать количественно, а не в духе "правильно/неправильно". Простейший случай такой оценки - сложение количества оптимальных значений параметров выхода.
Возьмем пример с картинки под буквой в. Реальные выходные значения 1, 1 и 0 сравним с оптимальными, которые будут соответственно 1, 0 и 1. Если оценивать адекватность примитивным способом, то её значение будет 1/3 или 33%. Для такой же ситуации выходные значения 1, 0 и 0 будут адекватны на 2/3 или 66%. Но так ли хороша эта система оценки адекватности?
Может быть, что конкретно вариант (1, 0, 0) фактически является худшим и, соответственно, максимально далеким от оптимального. Может быть, что складывать надо с разными весами: первый параметр важнее остальных, и тогда разница между (1, 1, 0) и (1, 0, 0) будет невелика. Для каждой нейросети нужно индивидуально практически высчитывать иерархию оптимальности каждого отдельного решения, а если у нейросети очень много входных вариантов, то посчитать их точно становится невыполнимой задачей, учитывая постоянные перестройки. Здесь мы приходим к важному выводу: в большинстве случаев адекватность решения невозможно точно оценить численно.
А поскольку большая часть наших взаимных и внутренних оценок - это попытки оценить адекватность собственных или чужих решений, мы мыслим качественно, говоря о том, какое решение хуже или лучше, но не всегда имея возможность уточнить насколько. Количественное мышление, позволяющее строго оценивать происходящее вокруг нас, стоит для мозга слишком дорого, поэтому мы, в первую очередь реагируя на изменения ситуации проводим в основном качественные сравнения. Это объясняет любовь человечества к классификации и делению всё на чёткие группы - с такими оценками намного быстрее и проще работать.
Теперь, когда мы разобрали эту непростую для восприятия, но очень важную для понимания математическую часть, мы можем наконец перейти к механизму веры. В следующей статье я начну разбирать это явление на простейших примерах.