? 🇨🇳 Команда Xiaomi выкатила в опенсорс (MIT) терминального агента MiMo Code (форк OpenCode). Разбираем его плюсы и архитектурные решения 👇 🧠 Делегирование памяти Как работает 99% агентов: когда окно забивается, модель просят «напиши саммари нашей беседы», старое выкидывают, саммари оставляют. Проблема в том, что у LLM есть эффект lost in the middle — при сжатии она теряет критические детали. К тому же, заставлять модель, которая прямо сейчас дебажит сложный баг, параллельно вести аккуратный конспект — гиблое дело. Она завалит и то, и другое. В MiMo Code процесс распараллелен. Основной агент вообще не занимается своей памятью. У него есть только файл notes.md (черновик), куда он может скидывать мысли. За сохранение контекста отвечает отдельный writer subagent. Он работает в фоне, не жрет токены основного цикла и складывает структурированные чекпоинты (текущая цель, дерево задач, выводы) в SQLite и Markdown. Когда контекст переполняется, сессия жестко обрезается, и агент "просыпа