Ученые из T-Bank AI Research разработали новую методику обучения больших языковых моделей (LLM), основанную на методах Trust Region, что позволяет повысить качество текстов, создаваемых искусственным интеллектом, на 15% по пяти ключевым показателям: точность, связность, стиль, логика рассуждений и информативность. Современные языковые модели зачастую теряют качество при длительном обучении, и разработанный подход помогает избежать этого, обновляя «настройки по умолчанию» модели на регулярной основе. В ходе проведенных экспериментов с использованием метрик Alpaca Eval 2.0 и Arena Hard был зафиксирован значительный рост качества ответов ИИ с 2.3 до 15.1 процентных пунктов по сравнению с традиционными методами. Метод Trust Region включает два типа обновлений: мягкое, которое подразумевает небольшие изменения на каждом шаге, и жесткое, при котором модель обновляется целиком. Эти обновления улучшают качество ответов моделей, повышая их способность давать более понятные и безопасные ответы,
Ученые T-Bank AI Research представили методику улучшения языковых моделей на 15%
25 апреля 202525 апр 2025
1 мин