Китайская компания DeepSeek, специализирующаяся на развитии искусственного интеллекта (ИИ), представила предварительную версию своей новой модели – DeepSeek V4, которая, по заявлениям компании, заметно сокращает разрыв с ведущими мировыми ИИ-системами. Модель выходит в двух вариантах — V4 Flash и V4 Pro. Оба построены на архитектуре mixture-of-experts и поддерживают контекст длиной до 1 миллиона токенов, что позволяет обрабатывать крайне большие документы, базы кода и сложные запросы в рамках одного диалога. Источник изображения: ChatGPTПо характеристикам DeepSeek V4 Pro достигает масштаба до 1,6 триллиона параметров, что делает её одной из крупнейших открытых моделей на рынке. При этом активируется только часть параметров за один запрос, что снижает вычислительные затраты и делает систему более эффективной в использовании. Компания утверждает, что новая модель существенно приблизилась к уровню ведущих решений от OpenAI и Google в задачах логического рассуждения, программирования и ана