Добавить в корзинуПозвонить
Найти в Дзене
Владимир Евланов

Постоянство мира и зрительная кора: новое исследование о работе нашего зрения

Ещё в прошлом веке появились первые серьёзные научные представления о том, как мозг обрабатывает зрительную информацию. Постепенно стало ясно, что восприятие — это не магия и не загадка, а вполне конкретный биологический процесс, который можно разбирать по уровням и описывать в терминах нейронной активности. Казалось, что общая схема уже понятна: от простого сигнала на входе к всё более сложным формам представления мира на выходе. И в этом смысле зрение перестало быть чем-то принципиально непознаваемым. Однако новое исследования показывает: даже самые «простые» уровни обработки зрения гораздо сложнее, чем мы думали. Речь идет о первичной зрительной коре — области мозга, которая первой получает визуальную информацию после сетчатки и считается начальной точкой корковой обработки. Именно здесь начинается превращение света, попадающего на сетчатку, в первые осмысленные элементы восприятия, из которых затем строится вся наша зрительная картина. Давайте попробуем разобраться, что на самом де
Оглавление

Ещё в прошлом веке появились первые серьёзные научные представления о том, как мозг обрабатывает зрительную информацию. Постепенно стало ясно, что восприятие — это не магия и не загадка, а вполне конкретный биологический процесс, который можно разбирать по уровням и описывать в терминах нейронной активности. Казалось, что общая схема уже понятна: от простого сигнала на входе к всё более сложным формам представления мира на выходе. И в этом смысле зрение перестало быть чем-то принципиально непознаваемым.

Однако новое исследования показывает: даже самые «простые» уровни обработки зрения гораздо сложнее, чем мы думали. Речь идет о первичной зрительной коре — области мозга, которая первой получает визуальную информацию после сетчатки и считается начальной точкой корковой обработки. Именно здесь начинается превращение света, попадающего на сетчатку, в первые осмысленные элементы восприятия, из которых затем строится вся наша зрительная картина.

Давайте попробуем разобраться, что на самом деле происходит на этом уровне и почему современные данные заставляют нас по-новому взглянуть на то, как мозг превращает поток света в устойчивый образ окружающего мира.

Старая картина: мир как набор линий

Классическая теория, которая доминировала десятилетиями, описывала работу зрительной коры довольно просто и красиво. Считалось, что нейроны в первичной зрительной коре работают как своеобразные фильтры. Каждый нейрон «настроен» на определённый признак: например, на линию под конкретным углом или на границу между светлым и тёмным. Если в поле зрения появляется нужный стимул — нейрон активируется. И стимул становится частью картины, которую мы впоследствии видим.

Когда свет попадает в глаза, информация сначала обрабатывается в сетчатке, затем передаётся через таламус в так называемую первичную зрительную кору — область мозга, обозначаемую как V1. Она находится в затылочной доле и считается первым корковым уровнем обработки зрительной информации. Именно здесь нейроны впервые начинают системно извлекать признаки изображения.
Зрительная кора V1 объединяет сигналы от палочек (и колбочек) в единое изображение, преобразуя точечные световые импульсы в структурированные контуры и формы. Основной механизм — ориентационная избирательность, где нейроны V1 реагируют на линии определенной ориентации, контраст и пространственную частоту, обрабатывая информацию параллельными потоками.
Долгое время считалось, что V1 выполняет относительно простую функцию — она как бы подготавливает «сырьё» для более сложного анализа в следующих зонах.

Из таких простых элементов, как из конструктора, постепенно собирается более сложное изображение. Сначала линии и контуры, потом формы, потом объекты.

-2

Эта идея хорошо согласовывалась с ранними экспериментами и даже легла в основу компьютерного зрения и нейросетей. В каком-то смысле мозг представлялся как система, которая просто складывает картинку из «палочек» — элементарных признаков с разной ориентацией и положением. Это удобная и интуитивная модель. Верная по своей сути, но, как оказалось, упрощенная в своих деталях.

Что именно было не так?

Если нейроны действительно работают как простые фильтры, жёстко привязанные к конкретным признакам в конкретной точке пространства, то вся система должна быть крайне чувствительна к малейшим изменениям изображения. Но в реальности этого не происходит. Один и тот же объект может находиться в разных местах, быть повернут, увеличен или уменьшен, освещён иначе — и всё равно мы без труда узнаём его как тот же самый. Это противоречие не могло не бросаться в глаза: либо классическая модель неполна, либо в ней упущен какой-то ключевой механизм, который обеспечивает устойчивость восприятия.

По мере того как накапливались экспериментальные данные, у исследователей всё больше складывалось ощущение, что в этой аккуратной и логичной модели чего-то не хватает. Если нейроны первичной зрительной коры действительно работают как жёстко настроенные фильтры, которые реагируют на конкретную линию в конкретном месте, то любое изменение положения или масштаба должно приводить к тому, что «нужный» нейрон просто перестанет активироваться. В этом случае система распознания была бы крайне нестабильной, мы теряли бы зрительный образ объекта как только совершили бы один неаккуратный шаг или наклон в сторону.

-3

Чтобы разобраться во всём этом, авторы статьи пошли не по пути добавления новых частных деталей к старой модели, а попытались изменить сам способ описания нейронов. Вместо того чтобы спрашивать «на какой именно признак реагирует нейрон», они задали более глубокий вопрос: «какие изменения входного изображения вообще влияют на его ответ, а какие — нет?». Это принципиально другой угол зрения. Речь уже не о том, что нейрон «видит», а о том, к каким изменениям он устойчив.

Дизайн и суть исследования

Экспериментально это выглядело следующим образом. Учёные регистрировали активность нейронов первичной зрительной коры у мышей, показывая им разнообразные визуальные стимулы, меняя их параметры. Они варьировали положение элементов в пространтсве, их ориентацию, меняли контраст и структуру, а затем смотрели, как именно меняется ответ нейрона.

При этом использовались современные вычислительные методы (машинное обучение), которые позволяют не просто зафиксировать реакцию, а восстановить внутреннюю «логику» нейрона — ту функцию, по которой он преобразует входной сигнал в выходную активность. Другими словами, хитрый математический алгоритм, который помогает найти общие паттерны в активности нейронов.

Обнаружилось нечто действительно интересное. Оказалось, что отдельный нейрон в первичной зрительной коре нельзя описать как простой датчик одного признака. Его работа устроена сложнее. Если внимательно посмотреть на его ответы, видно, что он реагирует не на один параметр, а на их сочетание, причём делает это неравномерно: к одним изменениям он очень чувствителен, а другие почти полностью игнорирует.

-4

Каждый такой нейрон получает на вход зрительный сигнал и преобразует его по своей внутренней «логике». И эта логика устроена так, что внутри входного сигнала выделяются два типа изменений. Первый тип — это то, что действительно влияет на ответ нейрона: если изменить эти параметры, его активность заметно меняется. Второй тип — это изменения, которые почти ничего не меняют: нейрон ведёт себя так, как будто «не замечает» их.

Подробнее об этой самой логике:
Когда мы говорим, что нейрон «преобразует сигнал», это не метафора. На вход к нему приходит не готовая картинка, а множество числовых сигналов от других нейронов. Каждый из них кодирует активность небольшой области изображения. В итоге нейрон получает не образ, а сложную комбинацию чисел и должен выдать один результат — насколько сильно ему активироваться.
Считалось, что нейрон накладывает на входное изображение некоторый шаблон и проверяет, насколько хорошо тот совпадает с увиденным. Если совпадение высокое — нейрон активируется сильнее, если низкое — слабее. То что активируется сильнее берется в рассвет построения некоего зрительного образа.
Однако более новые исследования показали, что такая картина неполная. Если посмотреть на поведение нейрона более внимательно, особенно при большом количестве разных стимулов, выясняется, что его реакция нельзя объяснить одним единственным шаблоном.
Вместо этого становится видно, что отклик нейрона устроен как функция, чувствительная к разным изменениям входного сигнала не одинаково. Некоторые изменения изображения сильно влияют на его активность — если они происходят, ответ нейрона заметно меняется. Другие изменения, даже достаточно значительные на уровне картинки, почти не влияют на результат.
Первый класс — это изменения, которые проходят через его «чувствительную часть». Это такие преобразования изображения, при которых совпадение с его внутренним шаблоном действительно меняется. Если меняется именно эта часть сигнала, нейрон это «замечает» и его активность либо растёт, либо падает.
Второй класс — это изменения, которые проходят через другую, условно «инвариантную часть». Это такие преобразования, при которых внутренняя оценка совпадения почти не меняется. С точки зрения нейрона, сигнал как будто остаётся тем же самым, даже если физически изображение немного изменилось.
Важно, что это не означает, будто нейрон «сознательно выбирает», что игнорировать. Речь идёт о структуре самой зависимости между входом и выходом. Если представить все возможные изменения изображения как пространство вариаций, то оказывается, что это пространство распадается на два типа направлений. В одних направлениях изменения сильно отражаются на активности нейрона, в других — почти не отражаются.
И именно это и создаёт эффект, который можно описать как разделение на «чувствительные» и «инвариантные» изменения. Но это не отдельный механизм внутри нейрона, а свойство того, как он математически преобразует входной сигнал.


Ключевой момент в том, что это разделение не задаётся где-то сверху и не является результатом работы всей зрительной системы в целом. Оно уже встроено в работу каждого конкретного нейрона. Даже на таком низком уровне происходит первичное «решение» о том, какие изменения в изображении считать значимыми, а какие — нет.

Вместо заключения

На первый взгляд может показаться, что это довольно узкий результат, касающийся конкретной области нейробиологии. Но если посмотреть шире, он неожиданно хорошо ложится на гораздо более старые идеи о том, как устроено наше восприятие. Ещё в начале XX века психологи гештальт-направления утверждали, что мы воспринимаем мир не как набор отдельных элементов, а как целостные структуры. Мы «достраиваем» формы, видим фигуры там, где есть лишь намёки, объединяем разрозненные элементы в единый образ. Долгое время это выглядело скорее как описание феноменов восприятия, чем как объяснение их механизма.

-5

Теперь становится понятнее, за счёт чего это вообще возможно. Если даже на уровне первичной зрительной коры отдельные нейроны уже устроены так, что они игнорируют часть изменений и сохраняют чувствительность к другим, это означает, что целостность восприятия не возникает где-то «сверху», на уровне мышления. Она начинает формироваться с самого начала обработки сигнала. Мозг не просто собирает картинку из деталей — он сразу стабилизирует её, убирая лишние колебания и удерживая те характеристики, которые позволяют воспринимать объект как нечто единое.

По сути, речь идёт о своеобразном эффекте «параллакса». Входной сигнал сам по себе нестабилен: освещение меняется, объекты смещаются, формы искажаются. Но за счёт того, что часть этих изменений систематически игнорируется, а часть — подчёркивается, в восприятии возникает устойчивый каркас. Именно он и даёт нам ощущение, что мир вокруг постоянен и непрерывен, хотя физически это далеко не так.

-6

И здесь становится видно, что способность «фильтровать лишнее» — это не побочный эффект, а центральный механизм. Без него мы бы просто тонули в потоке постоянно меняющейся информации. Но благодаря ему мы видим не хаос, а структуры, не набор линий, а объекты, не отдельные элементы, а целостные сцены.

Эстетично?
Эстетично?

Более того, этот же принцип, по всей видимости, лежит в основе того, что мы называем красотой и эстетикой. То, что воспринимается как гармоничное, часто как раз и обладает свойством устойчивости при изменениях: форма сохраняется при варьировании деталей, структура остаётся узнаваемой при разных условиях. Мозг «любит» такие объекты, потому что они хорошо соответствуют его способу обработки информации, позволяют реализовываться им легче (с меньшими затратами энергии) — они одновременно достаточно стабильны, чтобы быть узнаваемыми, и достаточно вариативны, чтобы не быть тривиальными.