! Похоже, в мире ИИ намечается небольшая революция. По данным VentureBeat, исследователи из нескольких университетов представили MeMo – фреймворк, который позволяет обновлять знания больших языковых моделей (LLM) без необходимости их полного переобучения. А это, друзья мои, огромный шаг вперед. Проблема обновления LLM – это головная боль для всех, кто работает с корпоративным ИИ. Существующие решения либо слишком дорогие, либо слишком медленные, либо ограничены размером контекстного окна. MeMo предлагает элегантное решение: она кодирует новые знания в отдельную, небольшую модель памяти, которая работает независимо от основной LLM. Эта модульная архитектура совместима как с моделями с открытым исходным кодом, так и с закрытыми, и позволяет избежать сложностей, связанных с RAG-пайплайнами и полным переобучением модели. Эксперименты показывают, что MeMo надежно обрабатывает сложные запросы даже при наличии шумов в конвейерах поиска. Она избегает катастрофического забывания, свойственно
📰 MeMo: Нейросеть для нейросети – апгрейд LLM без переобучения и +26% к производительности
СегодняСегодня
2 мин