Найти в Дзене
Былое без дум

Проверить алгеброй гармонию -2

Здравствуйте , дорогие читатели канала “Былое без дум”!

Продолжим поверять алгеброй гармонию. Возьмем 11 картин четырех мастеров: 5 -Магритта, 5- Дейнеки, 1 -Караваджо.Это будет наша обучающая выборка , куда вошли ,перечислим их слева направо Magritte_1, Magritte_2, Magritte_3, Magritte_4, Magritte_5,Deyneka_1, Deyneka_2, Deyneka_3, Deyneka_4, Deyneka_5,Caravadzio_1.

Первый ряд работы Магритта, второй Дейнеки и в третьем ряду одна работа Караваджо.
Первый ряд работы Магритта, второй Дейнеки и в третьем ряду одна работа Караваджо.

Надо бы побольше обучающую выборку, но мы ведь пример использования всяких интересных методов рассматриваем.

Напомню что наша гениальная идея состоит в том, чтобы образ картины в цифровой форме разложить на аппроксимацию и детали. А потом вычислить информационные расстояния-дивергенции между картиной и ее составляющими. И мы предполагаем, что каждый Мастер воплощая свой замысел на холсте по-своему распоряжается аппроксимацией и деталями и по дивергенциям между образом и аппроксимацией и образом и деталями можно автора распознать, пользуясь только алгебраическими методами. Почти из школьной программы. А еще интересно посмотреть как образ отличается от предельно возможного в информационном смысле. Поэтому нам потребуются еще две картины для вычисления дивергенций между образом и белым цветом, образом и черным цветом , и две эти картины принадлежат кисти великого Альфонса Алле “Ночная драка негров в угольном подвале” 1884г и “Малокровные девочки идущие к первому причастию в снежную пургу” 1883г. Хотя первую картину приписывают еще кисти Пола Билхолда 1882г. Я их здесь не привожу, но в наших расчетах они будут использоваться.

Наш алгоритм прост и включает следующие шаги:

  1. Оцифровка картин. Сделано уже до нас, и я воспользовался имеющимися в интернете графическими файлами. Файлы эти загружаются и далее программа оперирует с цифровыми образами каждой картины.
  2. Деконструкция образов на аппроксимацию и детали с использованием вайвлет преобразования
  3. Вычисление для каждого образа информационных расстояний дивергенций: две между образом и аппроксимацией ( в предположении 3-х мерного нормального распределения и по гистограммам), две -между образом и деталями, между образом и эталонной с точки зрения черноты “Дракой в подвале” , между образом и “Малокровными девочками”. Для дивергенции неравенство треугольник не выполняется, то есть по дивергенции между (А,Б) и между (Б,В) нельзя ничего сказать о дивереции между (А,В). Эти вычисленные дивергенции, числом шесть, составят цифровой дескриптор каждого цифрового образа.
  4. Классификация 11 цифровых дескрипторов по методу ближайших соседей. Имеем 11 6-мерных векторов. Вот это уже алгебра и геометрия в одном флаконе. Если бы все это было в 2-мерном пространстве, то мы бы взяли циркуль и давай рисовать непересекающиеся круги. Ну а в 6-мерном комп за нас это сделает , и двумерные проекции нарисует. Для иллюстративности.

По результатам классификации, если в каждый класс попадут работы только одного мастера, то это будет большой успех нашего алгоритма.

Если же нет, то не все алгоритмы достаточно полезны. Воспользуемся другим алгоритмом.

Не буду приводить всех числовых расчетов по ряду очевидных причин. Но если кто заинтересуется и захочет самостоятельно провести все вычисления, то код будет выложен в GitHub в ближайшее время.

Вот результаты классификации на первом шаге. Один класс с центром (красная точка) в начале координат. Фиолетовые точки это образы. ['Magritte_1', 'Magritte_3', 'Dayneka_2', 'Deyneka_4', 'Deyneka_3', 'Magritte_5', 'Deyneka_1', 'Caravadzio_1', 'Magritte_4', 'Deyneka_5', 'Magritte_2']

Один класс. Пространство 6 мерное , но рисунок это проекция на первые две координаты. Красная точка - центр класса, его центр тяжести.
Один класс. Пространство 6 мерное , но рисунок это проекция на первые две координаты. Красная точка - центр класса, его центр тяжести.

Второй шаг. Разбиение на два класса:

  • ['Magritte_3', 'Deyneka_4', 'Deyneka_1', 'Magritte_2'] – фиолетовые точки
  • ['Magritte_1', 'Dayneka_2', 'Deyneka_3', 'Magritte_5', 'Caravadzio_1', 'Magritte_4', 'Deyneka_5']
                                                                        Два класса
Два класса

Пропустим несколько шагов. Наконец на 7-ом шаге разбиение на 7 классов:

  • ['Caravadzio_1']
  • ['Magritte_1', 'Magritte_5']
  • ['Magritte_3', 'Deyneka_4', 'Deyneka_1']
  • ['Magritte_4']
  • ['Magritte_2']
  • ['Deyneka_3', 'Deyneka_5']
  • ['Dayneka_2']
                                                       Семь классов.
Семь классов.

На этом пока остановимся. В третьем классе Магритт затесался к двум Дейнекам. Это ошибка классификации. Вот и на графике мы видим, что центры классов сливаются почти (слипшиеся красные точки)

Ответа на интересующий нас вопрос о том как взялась девушка в бикини на картине 1934 года мы еще не получили. И это плохо. Но возможности алгебры почти школьного уровня мы продемонстрировали на примере распознавания образов. И это очень хорошо! Поэтому есть повод забыть о популярном высказавании о неприменимости знаний полученных за партой.

А вообще о графиках и элементарных функциях ими изображаемых лучше всего написано в книге В.Ерофеева “Москва -Петушки”:

Легко можно по графикам расклассифицировать трех героев этого литературного произведения.
Легко можно по графикам расклассифицировать трех героев этого литературного произведения.

А может быть нам поможет Deep Learning? Непременно затронем эту тему.