DeepSeek выпустил V4 в двух вариантах: V4-Flash — ~$0.14 за вход / $0.28 за выход на 1 млн токенов V4-Pro — ~$1.74 / $3.48 (временно снижено) Главное изменение — не сама модель, а стоимость вычислений. В большинстве прикладных сценариев (поиск по документам с генерацией, агенты, поддержка, внутренние ассистенты) цена работы снижается на порядок по сравнению с моделями уровня GPT. Критичный фактор — экономика кэша. Повторное использование контекста (системный промпт, документация, история диалога) стоит ~$0.003 за 1 млн токенов. Это меняет экономику систем: • длинные системные инструкции перестают быть дорогими • многошаговые сценарии становятся допустимыми по цене • системы с большим объёмом контекста перестают «наказывать» бюджет Контекст до ~1 млн токенов меняет архитектуру работы с документами: • снижается необходимость агрессивного дробления текста • можно передавать больше исходных данных целиком • упрощается логика поиска и подготовки данных Совместимость с API OpenAI делает