Первую версию Vintix AIRI представил год назад. Система работает в рамках обучения с подкреплением - подхода, при котором модель учится не по размеченным данным, а за счёт проб и ошибок в разных условиях. Изначально Vintix обучили на большом наборе разнородных задач, что дало ей универсальность. В обновлённой версии исследователи расширили обучающую выборку и встроили специальный модуль для работы с разными типами входных данных. Второй шаг оказался решающим: именно он позволил модели использовать закономерности из одной задачи для решения другой. Как именно устроен этот модуль, в пресс-релизе не раскрывается. Ключевое свойство новой Vintix - трансферабельность. Модель, обученная управлять роботом-манипулятором, может перейти к задаче климат-контроля в здании, не проходя отдельного обучения под новую среду. «Модель умеет переносить полезные закономерности между разными средами и уточнять свою стратегию по мере накопления нового опыта. Это особенно ценно для задач со сложными, меняющими