В последнее время в мире искусственного интеллекта появился новый феномен — нейронная сеть DeepSeek. Эта китайская разработка привлекла внимание своей впечатляющей производительностью и доступностью. В этой статье мы рассмотрим возможности DeepSeek и ее потенциальные применения на российском рынке, а также сравним ее с последним обновлением GPT. Возможности DeepSeek DeepSeek — это большая языковая модель (LLM), которая использует архитектуру Mixture-of-Experts (MoE), позволяющую ей активировать только необходимые нейронные сети для конкретных задач. Это значительно снижает вычислительные затраты и делает ее более эффективной по сравнению с другими моделями. DeepSeek способна обрабатывать до 128 тысяч токенов, что позволяет ей анализировать большие объемы текста и решать сложные задачи. Модель DeepSeek-V3 была обучена на кластере из 2048 GPU H800, что является относительно скромным по сравнению с другими крупными проектами. Несмотря на это, разработчики смогли добиться впечатляющих резу