О самом главном
В предыдущем посте «Текущее состояние 2020 » удалось, надеюсь, отразить общую направленность МРП-проекта: от восприятия машиной точек ---> к восприятию (и характеризации) объектов. Дальнейшее продвижение зависит от вычислительной производительности машин и логической мощи разработчика.
Осталась, однако, неразрешимость, обозначенная в разделе «Предобработка изображений (препарирование) », как бинаризация : измерение эквивалентности точек МРП-ячейки (шаблона) с приписыванием центру ячейки значения 1 (255 в 8-битном изображении — выполнение условия) или 0 (невыполнение условия). Здесь проявился принципиальный «раздрай» между локальной конструкцией МРП-сети и вовсе не локальной, а «площадной» природой яркостной (конкретно) эквивалентности. Т.е. точки-то, может, и эквивалентны, но только тем, что принадлежат одной поверхности с однородной структурой яркости (а это может быть, в частности, классическая «соль с перцем»).
На предыдущем этапе (предыдущий пост) эта принципиальная трудность была обойдена условием непременного участия человека в эксперименте. Зрительный анализатор человека оценивал картинку, определял объекты, их яркостные свойства, и, как следствие, принималось решение об использовании той или иной программы препарирования и параметрах этих программ (пороги сравнения и пр.). Т.е. это была автоматизация процесса, но не автоматическое зрение.
Попробуем приблизиться к решению этой проблемы автоматического функционирования.
Оценка имеющегося
1. Срез
Первое, что приходит в голову, решая проблему бинаризации, это — произвести плоский срез изображения. Если воспользоваться профилем FF0 предыдущего поста,
то плоско-параллельное сечение R на уровне Δ, вроде, вполне решает задачу. Первый вопрос: на каком уровне делать срез? Допустим, мы его фиксируем на середине возможной глубины изображения, т.е. на Δ = 128. Реализует эту препарацию простейшая программа, которая, не обращаясь к МРП-идеологии, просто осуществляет сканирование всего поля изображения, сравнивая в каждой точке значение яркости с порогом. Тогда это задание легко решается:
Столь же успешно решается задача по бинаризации Ф1 -----> Ф1-1:
Но вот задачу Ф2 удаётся удовлетворительно решить, только сменив уровень среза (например, на Δ = 228):
Т.е., вообще говоря, уровень среза необходимо подбирать оператору, оценивая изображение. А для перехода к автоматизму требуется реализовать перебор уровней среза с текущей оценкой результатов. Вопрос: как, по каким критериям автомату оценивать получаемые результаты, на чём остановиться? А в задаче Ф3, как выбирать уровень среза?
Полный текст см. на сайте //vbel-p.jimdo.com
Связаться с автором: vbel-p@yandex.ru