41 подписчик

DeepSeek готовит к запуску мультимодальную модель V4 с контекстным окном в 1 млн токенов

16 марта16 мар

~1 мин

🇨🇳 Китайская компания DeepSeek собирается представить в апреле новую мультимодальную модель искусственного интеллекта DeepSeekV4. Как сообщает издание Weixin, алгоритм получит значительные улучшения по сравнению с предыдущими версиями и сможет работать с контекстным окном объемом до 1 млн токенов. Будущая версия DeepSeekV4 может получить десятки триллионов параметров и будет способна работать с различными типами данных — текстом, изображениями и видео. Одним из основных направлений разработки стало развитие механизмов долгосрочной памяти языковых моделей. Исследования команды также направлены на совершенствование базовой архитектуры алгоритма. В частности, разработчики изучают возможность внедрения модулей «условной памяти», которые должны повысить эффективность обработки данных и снизить нагрузку на вычислительные ресурсы. Подписывайтесь на АФТ в MAX

DeepSeek готовит к запуску мультимодальную модель V4 с контекстным окном в 1 млн токенов.

Будущая версия DeepSeekV4 может получить десятки триллионов параметров и будет способна работать с различными типами данных — текстом, изображениями и видео. Одним из основных направлений разработки стало развитие механизмов долгосрочной памяти языковых моделей. Исследования команды также направлены на совершенствование базовой архитектуры алгоритма. В частности, разработчики изучают возможность внедрения модулей «условной памяти», которые должны повысить эффективность обработки данных и снизить нагрузку на вычислительные ресурсы.

Подписывайтесь на АФТ в MAX