Найти тему
Medi@Vyshka

Возможности зрения или представление о формах объектов

Согласно теории Марра, зрительное восприятие — это процесс определения по образам, что именно присутствует в окружающем мире и где именно оно находится. При этом Марр считает, что принципиально важными свойствами предмета, позволяющими определить, что перед нами, являются его форма и пространственная организация. Поэтому, уточняя функцию зрения, Марр пишет, что предназначение зрения — это построение некоторого описания форм и местоположений объектов. Возможности зрения, разумеется, гораздо шире, оно дает нам информацию об освещенности поверхностей, их яркостях, цветах и текстуре, их движении и др. Однако все это является вторичным, и основной задачей зрения по Марру является формирование представления о форме.

Англо-американский ученый Дэвид Марр внес фундаментальный вклад в раз­витие компьютерного подхода в изучении зрительного восприя­тия. Его книга «Зрение. Информационный подход к изучению пред­ставления и обработки зрительных образов» и другие работы яви­лись конкретной и продуктивной попыткой соединить логику пси­хологического анализа механизмов зрительного восприятия и ком­пьютерное моделирование этих механизмов.

Суть теории Марра состоит в том, что в основе зрительного восприятия лежат процессы сбора, представления, обработки и распознавания информации, наблюдаемого человеком реального мира. В его работе приводятся методологические предпосылки, описание используемого информационного подхода, структура, предлагаемая для представления процесса зрительного восприятия в целом, и путь, который привел к её формированию.

Основное содержание работы составляет информационный анализ феномена зрения человека, а именно способы построения вывода (алгоритмы), позволяющего по структуре изображения судить о структуре реального мира, а также обсуждение физических ограничений и допущений, обеспечивающих возможность построения такого вывода.

-2

Стадии репрезентации:

Исходное представление, с которого начинается процесс обработки информации, представляет собой массив значений яркостей воспринимаемой картины, зарегистрированных фоторецепторами сетчатки. В дальнейшем процесс получения информации о форме состоит из четырёх стадий. Каждая стадия выделяется по критерию используемой на этой стадии репрезентации. В теории Д. Марра выделяются четыре иерархических уровня, или модуля, анализа информации.

1) первый уровень назван об­разом, который рассматривается как пространственно-временное распределение световой энергии на сетчатке и уже является началом процесса видения.

2) Первоначальным эскизом, или наброском, — называется второй уровень анализа. Результатом переработки информации на этой стадии является описание структуры распределения света на сет­чатке: выделение текстуры, контуров, формы, взаимного распо­ложения объектов в пространстве, расстояния до наблюдателя.

3) 2,5-мерный эскиз — третий уровень переработки информации. На этом уровне обрабатывается информация, проанализирован­ная на предыдущем уровне. Здесь осуществляется определение общей ориентации и глубины контуров (как фигур, выделенных на некотором фоне, или видимых поверхностей) относительно наблюдателя.

4) Построение трехмерной модели — последняя стадия переработ­ки зрительной информации. На этом уровне анализа создается общая сцена видения ситуации в виде отдельных объектов неза­висимо от их расположения на сетчатке: у наблюдателя формиру­ется объемное изображение видимого мира, которое независимо (инвариантно) от его собственного положения в пространстве или расположения объектов друг относительно друга. На этом уровне наблюдателю презентируется мир уже распознанных предметов и их взаимное расположение.

-3

Автор: Николай Башкаров - студент Высшей школы журналистики и медиакоммуникаций (Казанский Федеральный Университет), профиль: Режиссура телевидения и цифровых медиапроектов.