417 подписчиков
В первой части мы сравнили OpenAI, DeepSeek и Qwen на задаче генерации тестов. Теперь идём глубже.
В новом обзоре – свежие результаты внутреннего бенчмарка Explyt Test: как справляются Claude Sonnet 4, Devstral и Qwen3-235B.
Смотрим, кто пишет сценарии сложнее, чей код компилируется лучше и что выбрать: коммерческое API или open-source с установкой в своём контуре.
Реальные цифры, формальные метрики, субъективные ощущения команды. Всё в материале по ссылке.
Около минуты
30 июня 2025