Исследователи из Высшей школы экономики (ВШЭ) и Института искусственного интеллекта AIRI разработали инновационный метод донастройки нейросетей, который ускоряет процесс адаптации моделей под новые задачи. Технология, получившая название GSOFT, основана на группировке и оптимальном перемешивании данных, что позволяет снизить вычислительные затраты без потери качества. Традиционные подходы к дообучению нейросетей, такие как LoRA или BOFT, требуют значительных ресурсов, особенно при работе с крупными моделями. Российские ученые предложили альтернативу — Group-and-Shuffle (GS) матрицы, которые разбивают данные на группы, обрабатывают их отдельно, а затем комбинируют оптимальным образом. Мы придумали, как формировать ортогональные матрицы, используя всего две матрицы специального вида, а не пять-шесть, как в прежних подходах. Это экономит ресурсы и время обучения.
— Николай Юдин, cтажер-исследователь Научно-учебной лаборатории матричных и тензорных методов в машинном обучении НИУ ВШЭ М