39 подписчиков
LADDER: как научить LLM решать сложные задачи без учителя.
Tufa Labs представила LADDER — Фреймворк, позволяющий языковым моделям самостоятельно улучшать навыки решения сложных задач. Технология имитирует человеческое обучение: ИИ разбивает проблемы на простые шаги, создаёт «учебный план» и постепенно наращивает мастерство решения.
Результаты LADDER впечатляют: модель Llama 3.2 достигла 82% точности после обучения по этому методу, а на тесте MIT Integration Bee модель Qwen2.5 набрала 73% с использованием Ladder и 90% с применением TTRL, превзойдя даже показатели OpenAI.
В основе LADDER лежит принцип рекурсивной декомпозиции: модель разбивает сложную задачу на цепочку постепенно усложняющихся шагов, создавая собственную «учебную программу». Работа фреймворка делится на три этапа: генерация «дерева вариантов», верификация и обучение с подкреплением.
TTRL позволяет проводить «экспресс-тренировки» прямо во время теста, адаптируя модель к конкретной задаче за секунды без вмешательства человека.
Около минуты
12 марта 2025