30 подписчиков

Лица Альтмана и Хуанга представили

2 января2 янв

1 мин

? DeepSeek опубликовала статью, в которой предлагается новая архитектура под названием mHC: https://huggingface.co/papers/2512.24880 В статье, соавтором которого является основатель Лян Вэньфэн, представлена структура, названная «Гиперсвязи с ограничениями на многообразие» (Manifold-Constrained Hyper-Connections). По словам авторов, она призвана повысить масштабируемость, одновременно снижая вычислительные и энергетические затраты на обучение передовых систем искусственного интеллекта. Подобные публикации DeepSeek в прошлом предвещали выпуск крупных моделей. Стартап из Ханчжоу год назад поразил индустрию моделью логического мышления R1, разработанной за гораздо меньшую стоимость, чем у конкурентов из Кремниевой долины. С тех пор DeepSeek выпустила несколько более компактных платформ, но ожидание выхода следующей флагманской системы, получившей широкое название R2, нарастает, и ожидается она примерно к Китайскому Новому году в феврале Предстоящая модель R2 от DeepSeek, запуск кот

Лица Альтмана и Хуанга представили?

DeepSeek опубликовала статью, в которой предлагается новая архитектура под названием mHC:

https://huggingface.co/papers/2512.24880

В статье, соавтором которого является основатель Лян Вэньфэн, представлена структура, названная «Гиперсвязи с ограничениями на многообразие» (Manifold-Constrained Hyper-Connections). По словам авторов, она призвана повысить масштабируемость, одновременно снижая вычислительные и энергетические затраты на обучение передовых систем искусственного интеллекта.

Подобные публикации DeepSeek в прошлом предвещали выпуск крупных моделей. Стартап из Ханчжоу год назад поразил индустрию моделью логического мышления R1, разработанной за гораздо меньшую стоимость, чем у конкурентов из Кремниевой долины.

С тех пор DeepSeek выпустила несколько более компактных платформ, но ожидание выхода следующей флагманской системы, получившей широкое название R2, нарастает, и ожидается она примерно к Китайскому Новому году в феврале

Предстоящая модель R2 от DeepSeek, запуск которой может состояться в ближайшие несколько месяцев, имеет потенциал снова перевернуть глобальный сектор искусственного интеллекта, несмотря на недавние успехи Google. Модель Gemini 3 от Google обогнала OpenAI в ноябре и заняла место в первой тройке в рейтинге LiveBench по производительности больших языковых моделей (LLM) в мире. Китайские недорогие модели, разработанные за гораздо меньшую стоимость, чем у конкурентов, заняли два места в топ-15

https://www.bloomberg.com/news/articles/2026-01-02/deepseek-touts-new-training-method-as-china-pushes-ai-efficiency

@marketheart