Публикация про теслу часть 3

30 ноября 202130 ноя 2021

1 мин

На изображении выше (справа внизу на рисунке 4) показаны два типа блока X. Блок X основан на стандартном остаточном узком месте с групповой сверткой (см. Статью Агрегированные остаточные преобразования для глубоких нейронных сетей). Каждый блок X состоит из a 1x1 conv, a 3x3 group convи a1x1 conv, где 1x1 convизменяется ширина канала. (b) Вариант второго шага(s=2). Процесс проектирования пространства проектирования в основном основан на построении основной части сети. Пространство проектирования AnyNetX имеет 16 степеней свободы , поскольку каждая сеть состоит из 4 этапов , и каждый этап имеет 4 параметра: количество блоков di, ширина блокаwi, соотношение узких biмест и групп gi. Согласно методу анализа EDF( эмпирическая функция распределения ошибок), определенному в статье, после поэтапного упрощения AnyNetX, наконец, превратился в пространство проектирования с 6 степенями свободы — Regnet. 6 параметров: d(глубина сети), w0(начальная ширина/выходной канал), наклон wawm(множитель ширин

На изображении выше (справа внизу на рисунке 4) показаны два типа блока X. Блок X основан на стандартном остаточном узком месте с групповой сверткой (см. Статью Агрегированные остаточные преобразования для глубоких нейронных сетей). Каждый блок X состоит из a 1x1 conv, a 3x3 group convи a1x1 conv, где 1x1 convизменяется ширина канала. (b) Вариант второго шага(s=2).

Процесс проектирования пространства проектирования в основном основан на построении основной части сети. Пространство проектирования AnyNetX имеет 16 степеней свободы , поскольку каждая сеть состоит из 4 этапов , и каждый этап имеет 4 параметра: количество блоков di, ширина блокаwi, соотношение узких biмест и групп gi.

Согласно методу анализа EDF( эмпирическая функция распределения ошибок), определенному в статье, после поэтапного упрощения AnyNetX, наконец, превратился в пространство проектирования с 6 степенями свободы — Regnet. 6 параметров: d(глубина сети), w0(начальная ширина/выходной канал), наклон wawm(множитель ширины), b(коэффициент узких мест) и g(ширина свертки группы).

После обработки магистральной нейронной сети RegNet предоставляет ряд функций с различным разрешением в разных масштабах. В этой сети извлечения функций, в самом низу, у нас очень высокое разрешение с очень низким количеством каналов, и низкое разрешение с высоким количеством каналов вверху. Таким образом, нейроны внизу используются для тщательного изучения деталей изображения, а вверху нейроны используются для понимания контекстной (семантической) информации сцены. Эти функции различных масштабов и разрешений войдут в следующую пирамидальную сеть функций обработки.

Особенность пирамидальных сетей (шея)

Алгоритмы раннего обнаружения объектов обычно напрямую подключают головку обнаружения к карте объектов последнего слоя последней ступени магистрали. В задаче обнаружения объектов мелкие сети (нижняя часть сетей) имеют высокое разрешение, что полезно для изучения деталей изображения; в глубоких сетях (верхняя часть сетей) разрешение низкое, что хорошо для семантического обучения. На практике мы сталкиваемся с тем, что трудно эффективно идентифицировать объекты разных масштабов одновременно на одной карте объектов.

Поэтому карты объектов разных этапов формируют сеть пирамид объектов для характеристики объектов разного масштаба, а затем выполняют обнаружение объектов на основе пирамиды объектов.