Найти в Дзене

Малые языковые модели (SLM): новые приоритеты в развитии ИИ

В конце 2022 года OpenAI представила свою крупную языковую модель (LLM), что спровоцировало волну аналогичных разработок от ведущих технологических компаний. Однако, несмотря на мощь больших моделей, их использование сопряжено с рядом проблем: высокие энергозатраты, риски распространения недостоверной информации и сложности с конфиденциальностью данных.

Почему малые модели (SLM) становятся приоритетом?

1. Ограниченные и проверенные данные

  • В отличие от LLM, обучающихся на огромных, но не всегда надежных интернет-данных, SLM работают с узкоспециализированными наборами информации. Это снижает риск генерации токсичного или ложного контента.
  • Пример — Meditron от EPFL, модель, обученная исключительно на медицинских данных из PubMed и клинических руководств.

2. Энергоэффективность и доступность

  • SLM требуют значительно меньше вычислительных ресурсов — некоторые могут работать даже на смартфоне.
  • Это делает их идеальными для локального использования, особенно в условиях ограниченного интернет-доступа.

3. Безопасность и конфиденциальность

  • SLM функционируют в закрытых системах, что исключает утечку данных, в отличие от облачных LLM вроде ChatGPT.
  • Например, при обработке медицинских запросов или корпоративной документации SLM не передают информацию на внешние серверы.

4. Точечная адаптация под задачи

  • Технология RAG (Retrieval-Augmented Generation) позволяет дополнять модели актуальными данными без полного переобучения.
  • В EPFL уже тестируют SLM для административных процессов, расшифровки лекций и анализа медицинских изображений.

Meditron: пример успешного применения SLM

Разработанная EPFL и Йельской школой медицины, эта модель превзошла средние результаты врачей на американских медицинских экзаменах. Ее ключевые преимущества:

  • Открытый исходный код — прозрачность и возможность доработки сообществом.
  • Локализация данных — включение информации из регионов, традиционно недостаточно представленных в глобальных базах.
  • Постоянное улучшение — врачи со всего мира тестируют модель в реальных условиях, повышая ее точность.

Перспективы: персонализированная медицина и не только

Исследователи EPFL и CHUV работают над SLM, способными анализировать ангиограммы для прогнозирования сердечных приступов. В сочетании с данными носимых устройств это может стать основой для персонализированной медицины — при условии надежной защиты конфиденциальности.

Если 2023 год был эпохой больших моделей, то 2025 может стать временем их компактных, безопасных и специализированных аналогов. SLM сочетают в себе эффективность, экономичность и надежность, что делает их оптимальным решением для бизнеса, медицины и науки.

Источник: https://actu.epfl.ch/news/small-model-approach-could-be-more-effective/

Больше интересного – на медиапортале
https://www.cta.ru/