Найти тему
Машинное обучение

Психология сверточной нейронной сети

Оглавление

Понимание сети, лежащей в основе распознавания объектов как мозга

В каждый момент наша сенсорная система собирает несметное количество информации и отправляет их. в наш мозг в формате, который он может понять. За доли секунды, глядя на сцену, мы может идентифицировать отдельные объекты в пределах нашего обзора. Даже в толпе мы можем отличить людей и деревья, кроме того, мы можем быстро обнаружить знакомые нам лица. Как мы сделай это? Более того, может ли машина видеть так, как видим мы?

Механизм зрения человека

Основной механизм нашего зрения таков: свет из внешнего поля зрения проникает в наши глаза. Эти огни проецируются в рецептивное поле фоторецептивных клеток, где световая проекция преобразуется в электрические сигналы. Эти сигналы от обоих глаз встречаются в узле, называемом перекрестом зрительного нерва. Здесь сигналы разделены на обе стороны полушария на основе их исходного поля зрения. Эти разделенные сигналы проходят по разным маршрутам, прежде чем попасть в кору. Один из основные маршруты обнаруживают пространственную информацию (тектопульвинарный путь), а другой path отвечает за обработку узоров и цветов (коленчатый путь).

-2

Итак, теперь наш мозг успешно скомпоновал световые сигналы в узоры, цвета, ориентация, местоположение и т. д. Первичная зрительная кора в задней части нашего мозга получает эти сигналы и распространяет их глубже в наш мозг. Один из основных путей - через нижняя височная кора. Поскольку сигналы проходят через нашу нижнюю височную кору, они сходятся и становятся все более сложными. Теперь мозг может определить, что комбинация этих сигналов основана на знаниях, которые мы уже сохранили в наших мозг. Это известный процесс, через который проходит наш мозг, чтобы распознать и идентифицировать объект.

Один из ключевых выводов здесь сделан лауреатами Нобелевской премии 1981 года по физиологии и психологии. Медицики, Дэвид Хьюбел и Торстен Н. Визель. Хьюбел и Визель обнаружили, что рецептивные поля, которые вызывают ответные сигналы на каждом уровне этих сенсорных путей, построены в ответ на предыдущие уровни, чтобы адаптировать различную шкалу входов на каждом этапе путь. Другими словами, на каждом этапе передачи может выполняться консолидация. последовательно, чтобы принять более сложную структуру, прежде чем она выдаст ответный сигнал. От света до краев и цветов до объектов в сцене, движений и т. д.

Использование Леонардо да Винчи сфумато является представлением и доказательством того, как наше видение использует информация о краях для изучения пространственной разницы и распознавания объектов на сцене. (Фото
Эрик ТЕРРАД на Unsplash)
Использование Леонардо да Винчи сфумато является представлением и доказательством того, как наше видение использует информация о краях для изучения пространственной разницы и распознавания объектов на сцене. (Фото Эрик ТЕРРАД на Unsplash)

Эта идея последовательной и накапливающейся абстракции лежит в основе архитектуры сверточная нейронная сеть (CNN, ConvNet). CNN принимает эту идею роста шкалы рецептивных полей, которые обрабатывают все более сложные входные данные, чтобы иерархически развивать наше восприятие и применять его на каждом уровне свертки. Затем это имитирует абстракцию обработки нашего зрения с помощью метода объединения. Тогда мы можем сопоставить семантические метки с обнаруженными сегментами, о которых мы поговорим в отдельнойпосле.

Обратите внимание, что цвет на этой диаграмме предназначен для иллюстрации всего процесса. в на самом деле CNN, мы будем вычислять каждый канал RGB отдельно. Схема автора
Обратите внимание, что цвет на этой диаграмме предназначен для иллюстрации всего процесса. в на самом деле CNN, мы будем вычислять каждый канал RGB отдельно. Схема автора

В сверточной нейронной сети, как и в простой искусственной нейронной сети (для refresher:https://towardsdatascience.com/psychology-of-artificial-neural-networks-2786d11f7544), мы обновляем веса каждого фильтра свертки, который пытается определить лучшие прогнозные параметры на уровне подгруппы. Затем он абстрагируется до вывести суть, которая фиксирует отдельные свойства.

-5

Мы обсудили основы человеческого зрения и его связь с компьютерным зрением. Но давай Найдите минутку, чтобы подумать о процессе. Когда мы смотрим на картинку выше, мы видим собака, даже если есть нечто большее, чем просто собака, мы отдаем приоритет тому, что, по нашему мнению, последовательно определяйте, что важнее. Ключ к успешному признанию сцена привлекает наше внимание. В следующем посте мы обсудим более подробное сравнение внимание человека к сети внимания и о том, как теория предсказательного кодирования (обсуждалось в предыдущем посте https://towardsdatascience.com/psychology-of-artificial-neural-networks-2786d11f7544) был применен для улучшения распознавания объектов сети.

Рекомендации

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC1359523/

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC2718241/

Удачного обучения!

-6