Китайский AI-стартап DeepSeek снова в центре внимания! Не успели мы обсудить их прошлую модель, как компания выпустила новую экспериментальную версию — DeepSeek-V3.2-Exp. И это не просто очередное обновление. Разработчики представили новую технологию, которая может серьезно изменить правила игры в мире нейросетей, сделав их мощнее и, что самое главное, в разы дешевле. Давайте разберемся, что это за зверь и почему он так важен. DeepSeek-V3.2-Exp — это, по сути, улучшенная и модифицированная версия недавней модели V3.1-Terminus. Главное нововведение, которое делает эту модель особенной, — технология DeepSeek Sparse Attention (DSA), или "разреженное внимание". Звучит сложно, но на деле все просто. Представьте, что нейросети нужно прочитать огромный документ на 300 страниц, чтобы ответить на один ваш вопрос. Старые модели, работающие по принципу "полного внимания", были вынуждены перечитывать и сопоставлять каждое слово с каждым другим словом во всем тексте. Это как если бы вы, читая книгу
✴️ DeepSeek-V3.2 — новая модель китайского стартапа
1 октября 20251 окт 2025
61
3 мин