Семейство Трансформеров: от BERT до MoE и Mamba Полный гид по архитектурам семейства Transformer: от оригинала 2017 года до MoE, ViT и постТрансформерных моделей 2024–2025. Curriculum для обучения с подкреплением: от простого к сложному Что такое Curriculum RL, как работает обучение по расписанию задач и почему AlphaGo, AlphaStar и роботы OpenAI не обошлись без него.