Microsoft выпустила три новых модели искусственного интеллекта серии Phi 3.5, каждая из которых обещает значительные улучшения в производительности и доступности для разработчиков. В отличие от предыдущих релизов, Microsoft сделала акцент на оптимизации ресурсов, что делает эти модели доступными для более широкого круга пользователей.
Краткий обзор моделей
- Phi 3.5 Mini Instruct
Эта компактная модель с 3.8 миллиардами параметров создана для выполнения сложных задач в условиях ограниченных вычислительных ресурсов. Phi 3.5 Mini Instruct поддерживает контекст длиной 128K токенов, что делает её идеальной для задач, связанных с генерацией кода, решением математических проблем и логическими выводами. Несмотря на малые размеры, модель демонстрирует выдающуюся производительность, обгоняя такие модели, как Llama 3.1 8B и Mistral 7B, в ряде бенчмарков. - Phi 3.5 MoE (Mixture of Experts)
Модель Phi 3.5 MoE включает в себя 42 миллиарда параметров, из которых активно используются только 6.6 миллиардов при генерации. Этот подход позволяет модели оставаться эффективной, сохраняя высокую производительность в сложных задачах, таких как многоязыковое понимание и математические вычисления. Модель поддерживает контекст длиной 128K токенов и способна конкурировать с более крупными моделями, такими как Gemini Flash, особенно в области кодирования и многозадачного понимания языка. - Phi 3.5 Vision Instruct
Последняя в серии модель ориентирована на мульти-модальное распознавание и анализ изображений и видео. Phi 3.5 Vision Instruct обладает 4.2 миллиардами параметров и поддерживает 128K контекста, что делает её идеальной для задач, связанных с пониманием изображений, оптическим распознаванием символов (OCR) и суммаризацией видео. Модель обучалась на 500 миллиардах токенов, что позволило ей показать выдающиеся результаты в бенчмарках, лишь незначительно уступая таким гигантам, как GPT-4o и Gemini 1.5 Pro.
Открытый доступ и перспективы
Все три модели доступны для скачивания и использования под открытой лицензией MIT, что позволяет разработчикам свободно модифицировать и интегрировать их в свои приложения. Microsoft позиционирует этот релиз как важный шаг на пути к поддержке открытого сообщества разработчиков, предоставляя инструменты для внедрения передовых AI-технологий в коммерческие и исследовательские проекты.
Что это значит? Релиз Phi 3.5 открывает новые возможности для разработчиков, стремящихся интегрировать мощные AI-решения в свои приложения, при этом значительно снижая требования к ресурсам. Это особенно актуально для небольших компаний и исследовательских групп, которые теперь могут использовать передовые технологии без необходимости в дорогостоящей инфраструктуре.