Как компьютер научился видеть: эволюция моделей обнаружения объектов от R-CNN до YOLO и Transformer
Представьте: вы смотрите на улицу через окно за 0.1 секунды. Вы сразу видите, где машина, где человек, а где просто фонарь. Для нас это естественно. Для компьютера ещё 10 лет назад этот «взгляд» был математическим адом. Пиксель — это просто цифра. Как научить железку не просто «смотреть», а видеть? Сегодня я, как эксперт в области Computer Vision, проведу вас по эволюции моделей. От неповоротливых монстров до молниеносных нейросетей. И главное — вы поймёте, почему 99% точности — это миф, и ради чего создатели жертвуют скоростью...