DeepSeek-V3.2: как открытая модель впервые приблизилась к Олимпиаде разума
Когда в ИИ-сообществе говорят о «прорыве», чаще всего подразумевают закрытые корпорации — те, у кого есть бюджет на тысячи A100 и пайплайны, доступный лишь гигантам. Но DeepSeek-AI снова нарушает правило: их DeepSeek-V3.2 — пример того, как открытая разработка превращается в настоящую технологическую гонку, где open-source догоняет — и местами обгоняет — элитные закрытые модели. Но в этот раз всё иначе. DeepSeek-V3.2 не просто улучшает предыдущую версию — она впервые демонстрирует золотые достижения...
Когда языковая модель становится программистом: почему Program-of-Thought опережает Chain-of-Thought
Сегодня LLM-миры переживают любопытный переломный момент: модели становятся всё «умнее», но в численных задачах… продолжают ошибаться в сложении. CoT-подсказки (Chain-of-Thought - цепочка рассуждений), которые должны были стать мостом к рассуждению, неожиданно показали свою слабость: LLM отлично придумывают объяснения, но далеко не всегда правильно считают. Авторы Program-of-Thought prompting (PoT - программа рассуждений) предложили почти крамольную идею: перестать заставлять модель думать и считать одновременно...