Эволюция FPN: Модель (а) - это традиционная пирамида изображений, которая использует пирамиду изображений для построения пирамиды функций. Объекты вычисляются на каждом из масштабов изображения независимо. Это происходит очень медленно. Модель (b) использует глубокие сверточные сети(сверточные сети) в одной карте объектов. Этот метод представляет семантику более высокого уровня. Модель (c)-это алгоритм детектора одиночных снимков(SSD), который будет повторно использовать многомасштабные карты объектов из разных слоев для прогнозирования. Но у него слабая семантика на низком уровне. Модель (d) - это архитектура, которая сочетает семантически сильные функции низкого разрешения с семантически слабыми функциями высокого разрешения с помощью нисходящего пути и боковых соединений. Эта архитектура извлекает уроки из стратегии обнаружения SSD и “быстрых подключений” в ResNet. Для получения более подробной информации, пожалуйста, обратитесь к статье: Функциональные пирамидальные сети для обнару