Китайская корпорация Alibaba расширила свою линейку Qwen2.5, добавив две новые модели искусственного интеллекта: Qwen2.5−7B-Instruct-1M и Qwen2.5−14B-Instruct-1M. Эти разработки, как и популярная платформа DeepSeek, обладают открытым исходным кодом. Их отличительная особенность — способность работать с контекстными окнами объёмом до 1 млн токенов, что делает их особенными среди всех существующих решений. Новинки используют методику редкого внимания, концентрируясь только на самых значимых частях входящей информации. Это позволяет моделям обрабатывать данные такого объёма в 3-7 раз быстрее, чем при использовании традиционных технологий, а также генерировать до 8000 токенов на выходе. Разработчики подчёркивают, что для такого подхода моделям требуется выделять наиболее информативные фрагменты контекста, что является довольно сложной задачей, недоступной многим другим нейросетям. По словам команды, тестирование показало, что обе модели успешно извлекают скрытые данные из текстов объёмом д
Alibaba представила усовершенствованную бесплатную альтернативу ChatGPT
28 января 202528 янв 2025
3
1 мин