Найти в Дзене
CodeLab

Alibaba представила ИИ-модель Qwen 2.5, способную обрабатывать до 1 млн токенов

Китайская компания Alibaba ночью представила новые модели искусственного интеллекта Qwen2.5-1M и Qwen2.5-Instruct-1M, которые способны обрабатывать до 1 миллиона токенов, что эквивалентно примерно миллиону английских слов. Это значительный шаг вперед по сравнению с моделью o1 от OpenAI, которая обрабатывает только 200 тысяч токенов. В этой статье мы сравним возможности Qwen2.5-VL, ChatGPT и DeepSeek-V3, чтобы понять, как эти модели конкурируют на арене искусственного интеллекта. Следите за новостями и развитием ИИ в моем телеграмм канале - https://t.me/pywithCodeLab Qwen2.5-VL — это семейство моделей, разработанных Alibaba, которые способны выполнять широкий спектр задач, включая анализ текста, изображений и видео. Флагманская модель Qwen2.5-VL-72B, по заявлениям разработчиков, превосходит GPT-4 от OpenAI в таких задачах, как понимание видео, решение математических задач и анализ документов. Нейронка умеет буквально все: Так, генератор может создать видео длиной до 5 секунд всего за 10
Оглавление

Китайская компания Alibaba ночью представила новые модели искусственного интеллекта Qwen2.5-1M и Qwen2.5-Instruct-1M, которые способны обрабатывать до 1 миллиона токенов, что эквивалентно примерно миллиону английских слов. Это значительный шаг вперед по сравнению с моделью o1 от OpenAI, которая обрабатывает только 200 тысяч токенов. В этой статье мы сравним возможности Qwen2.5-VL, ChatGPT и DeepSeek-V3, чтобы понять, как эти модели конкурируют на арене искусственного интеллекта. Следите за новостями и развитием ИИ в моем телеграмм канале - https://t.me/pywithCodeLab

-2

Мощные мультизадачные модели Qwen2.5-VL

Qwen2.5-VL — это семейство моделей, разработанных Alibaba, которые способны выполнять широкий спектр задач, включая анализ текста, изображений и видео. Флагманская модель Qwen2.5-VL-72B, по заявлениям разработчиков, превосходит GPT-4 от OpenAI в таких задачах, как понимание видео, решение математических задач и анализ документов.

Нейронка умеет буквально все:

  • • Обошла DeepSeek V3 во всех авторитетных бенчмарках — Arena Hard, LiveBench, LiveCodeBench, GPQA-Diamond
  • • Умеет генерить фотореалистичные пикчи
  • • Умеет генерить видео ВЫСОКОГО качества
  • • Пишет код, как сеньор-программист
  • • Ищет инфу в интернете
  • • API снова совместимо с OpenAI — у Альтмана забирают последние центы

Так, генератор может создать видео длиной до 5 секунд всего за 10 минут, а генератор изображений работает в режиме реального времени. Кроме того, Qwen Chat предлагает возможность поиска в интернете. Нажав кнопку Web Search, можно получить актуальные данные со ссылками на источники. Теперь Alibaba делает свои технологии доступными широкой аудитории. Все функции сайта Qwen, включая генерацию контента и анализ данных, бесплатны.

-3

Ограничения Qwen2.5-VL

Несмотря на впечатляющие возможности, Qwen2.5-VL имеет свои ограничения. Будучи китайской разработкой, модель подчиняется строгим регуляциям, включая запрет на обсуждение политических тем, таких как критика председателя Си Цзиньпина. Это связано с требованиями китайского правительства, чтобы ИИ отражали "социалистические ценности".

Qwen2.5-VL демонстрирует, что Китай активно укрепляет свои позиции в области искусственного интеллекта, соревнуясь с такими гигантами, как OpenAI и DeepSeek. Однако, несмотря на впечатляющие технические достижения, Qwen2.5-VL сталкивается с ограничениями, связанными с государственной цензурой. Но остаётся вопрос: смогут ли эти технологические достижения перевесить репутационные проблемы, связанные с обвинениями в государственной цензуре и массовой слежке? Друзья, буду ждать вас в своем телеграмм канале, давайте обучаться вместе! https://t.me/pywithCodeLab

В любом случае, Qwen2.5-VL — это не просто инновация, а стратегический шаг в гонке за лидерство в сфере искусственного интеллекта, которая всё больше становится ареной геополитического противостояния.

-4