про теслу 1

30 ноября 202130 ноя 2021

1 мин

Эволюция FPN: Модель (а) - это традиционная пирамида изображений, которая использует пирамиду изображений для построения пирамиды функций. Объекты вычисляются на каждом из масштабов изображения независимо. Это происходит очень медленно. Модель (b) использует глубокие сверточные сети(сверточные сети) в одной карте объектов. Этот метод представляет семантику более высокого уровня. Модель (c)-это алгоритм детектора одиночных снимков(SSD), который будет повторно использовать многомасштабные карты объектов из разных слоев для прогнозирования. Но у него слабая семантика на низком уровне. Модель (d) - это архитектура, которая сочетает семантически сильные функции низкого разрешения с семантически слабыми функциями высокого разрешения с помощью нисходящего пути и боковых соединений. Эта архитектура извлекает уроки из стратегии обнаружения SSD и “быстрых подключений” в ResNet. Для получения более подробной информации, пожалуйста, обратитесь к статье: Функциональные пирамидальные сети для обнару

Для получения более подробной информации, пожалуйста, обратитесь к статье: Функциональные пирамидальные сети для обнаружения объектов(FPN) от Facebook AI Research (FAIR)Возвращаясь ко дню Tesla AI, как распознать автомобиль с низким разрешением на изображении выше? Они используют BiFPN для достижения многомасштабного слияния пирамид функций.

BiFPN-это взвешенная двунаправленная пирамидная сеть функций, предложенная в статье, EfficientDet: Масштабируемое и эффективное обнаружение объектов(BiFPN) Google Research, Мозговая команда в 2019 году(v1).

BiFPN-это расширенная версия FPN. Есть два основных улучшения:

После слияния функций сверху вниз он снова выполняет слияние снизу вверх.
При объединении объектов BiFPN замечает, что, поскольку разные входные объекты имеют разное разрешение, они обычно вносят неравномерный вклад в выходной объект. Таким образом, они добавляют дополнительный вес для каждого ввода.