📅 31 декабря 2025 года команда DeepSeek-AI опубликовала исследование mHC (Manifold-Constrained Hyper-Connections) — новый подход к архитектуре нейросетей, который делает обучение больших моделей стабильнее и эффективнее. 📍 В чём была проблема Последние годы архитектура нейросетей практически не менялась — все используют классическое residual connection (остаточное соединение), предложенное ещё в ResNet в 2016 году. Формула простая: выход = вход + изменения Это работает, но не даёт пространства для улучшений. Недавно появился подход Hyper-Connections (HC) — вместо одного потока данных используется несколько параллельных, что увеличивает производительность модели. Проблема HC: При масштабировании на большие модели возникает серьёзная нестабильность обучения — сигнал либо взрывается, либо затухает при прохождении через слои. ⚡️ Что предложили в DeepSeek Исследователи создали mHC (Manifold-Constrained Hyper-Connections) — улучшенную версию HC, которая решает проблему нестабильности