40 подписчиков

LADDER: как научить LLM решать сложные задачи без учителя.

Tufa Labs представила LADDER — Фреймворк, позволяющий языковым моделям самостоятельно улучшать навыки решения сложных задач. Технология имитирует человеческое обучение: ИИ разбивает проблемы на простые шаги, создаёт «учебный план» и постепенно наращивает мастерство решения.

Результаты LADDER впечатляют: модель Llama 3.2 достигла 82% точности после обучения по этому методу, а на тесте MIT Integration Bee модель Qwen2.5 набрала 73% с использованием Ladder и 90% с применением TTRL, превзойдя даже показатели OpenAI.

В основе LADDER лежит принцип рекурсивной декомпозиции: модель разбивает сложную задачу на цепочку постепенно усложняющихся шагов, создавая собственную «учебную программу». Работа фреймворка делится на три этапа: генерация «дерева вариантов», верификация и обучение с подкреплением.

TTRL позволяет проводить «экспресс-тренировки» прямо во время теста, адаптируя модель к конкретной задаче за секунды без вмешательства человека.

LADDER: как научить LLM решать сложные задачи без учителя. Tufa Labs представила LADDER — Фреймворк, позволяющий языковым моделям самостоятельно улучшать навыки решения сложных задач.

Около минуты

12 марта 2025