Найти в Дзене
FABULAai

Microsoft представила новую серию моделей Phi 3.5: больше производительности, меньше ресурсов

Microsoft выпустила три новых модели искусственного интеллекта серии Phi 3.5, каждая из которых обещает значительные улучшения в производительности и доступности для разработчиков. В отличие от предыдущих релизов, Microsoft сделала акцент на оптимизации ресурсов, что делает эти модели доступными для более широкого круга пользователей.

create with Flux
create with Flux

Краткий обзор моделей

  1. Phi 3.5 Mini Instruct
    Эта компактная модель с 3.8 миллиардами параметров создана для выполнения сложных задач в условиях ограниченных вычислительных ресурсов. Phi 3.5 Mini Instruct поддерживает контекст длиной 128K токенов, что делает её идеальной для задач, связанных с генерацией кода, решением математических проблем и логическими выводами. Несмотря на малые размеры, модель демонстрирует выдающуюся производительность, обгоняя такие модели, как Llama 3.1 8B и Mistral 7B, в ряде бенчмарков.
  2. Phi 3.5 MoE (Mixture of Experts)
    Модель Phi 3.5 MoE включает в себя 42 миллиарда параметров, из которых активно используются только 6.6 миллиардов при генерации. Этот подход позволяет модели оставаться эффективной, сохраняя высокую производительность в сложных задачах, таких как многоязыковое понимание и математические вычисления. Модель поддерживает контекст длиной 128K токенов и способна конкурировать с более крупными моделями, такими как Gemini Flash, особенно в области кодирования и многозадачного понимания языка.
  3. Phi 3.5 Vision Instruct
    Последняя в серии модель ориентирована на мульти-модальное распознавание и анализ изображений и видео. Phi 3.5 Vision Instruct обладает 4.2 миллиардами параметров и поддерживает 128K контекста, что делает её идеальной для задач, связанных с пониманием изображений, оптическим распознаванием символов (OCR) и суммаризацией видео. Модель обучалась на 500 миллиардах токенов, что позволило ей показать выдающиеся результаты в бенчмарках, лишь незначительно уступая таким гигантам, как GPT-4o и Gemini 1.5 Pro.

Открытый доступ и перспективы

Все три модели доступны для скачивания и использования под открытой лицензией MIT, что позволяет разработчикам свободно модифицировать и интегрировать их в свои приложения. Microsoft позиционирует этот релиз как важный шаг на пути к поддержке открытого сообщества разработчиков, предоставляя инструменты для внедрения передовых AI-технологий в коммерческие и исследовательские проекты.

Что это значит? Релиз Phi 3.5 открывает новые возможности для разработчиков, стремящихся интегрировать мощные AI-решения в свои приложения, при этом значительно снижая требования к ресурсам. Это особенно актуально для небольших компаний и исследовательских групп, которые теперь могут использовать передовые технологии без необходимости в дорогостоящей инфраструктуре.