Свежая работа Tapered Language Models: в трансформере не всем слоям быть одинаково широкими
Ширину сужают от входа к выходу, качество то же, ресурсов меньше. Умное распределение вместо равномерного. В юрфирме та же логика. Партнёры тонут в первичке: входящие с сайта, «а вы возьмётесь?», проверки контрагентов, брифы. На реальные сделки времени нет, а собственник думает нанять ещё двух менеджеров. Мы заходим иначе. AI-агент на первой линии ловит...