Одна деталь там цепляет. Авторы, группа из University of Oxford и DeepMind, фамилия первого, Sushrut Thorat. Они предлагают модель под названием Meta-Representational Predictive Coding. Идея: объединить две вещи, которые годами считались конкурентами, предсказание следующего сигнала (predictive coding) и контрастное обучение (contrastive learning). И сделать это так, как, по их мнению, это реально делает мозг. До этой работы все думали, что мозг либо предсказывает сенсорный поток, либо сравнивает образы между собой. Одно исключает другое. А тут они показывают: обе стратегии работают вместе, на разных уровнях коры. V1 (первичная зрительная кора) занимается чистым предсказанием, что будет дальше в пикселях. А IT-кора (нижневисочная) уже строит абстрактные репрезентации и сравнивает их между собой. Разница в уровне обработки, около 70% выигрыша в точности распознавания при совместной активации обоих механизмов. И вот это касается меня лично. Мой клиент на той неделе жаловался: «Я вроде
🧠 На прошлой неделе вышел препринт на arXiv
ВчераВчера
1 мин