Китайский стартап DeepSeek на днях произвел революцию. Он выкатил инновационную модель ИИ, способную задвинуть гиганта OpenAI. ChatGPT в AppStore он уже обогнал. Козырной туз DeepSeek — цена Его модель в 14 раз дешевле GPT-4 и обучалась на графических процессорах Nvidia H800 всего 2 месяца. Такую немыслимую эффективность китайской модели подарили уникальные архитектуры Multi-token Prediction (MTP) и Mixture of Experts (MoE). Пока OpenAI ставит на сложные и дорогие системы с миллиардами параметров, DeepSeek использует минимум вычислительных ресурсов без ущерба производительности. DeepSeek – убийца Nvidia? «Покупайте дорогущие GPU для обучения ИИ, без этого никак!», – убеждал нас американский гигант. Но DeepSeek, построенный на менее мощных GPU, показал, что сверхдорогие серверы не так уж и нужны. Пока чат GPT-4 активирует 1,8 трлн параметров одновременно, DeepSeek применяет другую стратегию, где затраты на обучение снижены до 90%. И что самое печальное для конкурентов, его производитель