417 подписчиков

В первой части мы сравнили OpenAI, DeepSeek и Qwen на задаче генерации тестов. Теперь идём глубже.

В новом обзоре – свежие результаты внутреннего бенчмарка Explyt Test: как справляются Claude Sonnet 4, Devstral и Qwen3-235B.

Смотрим, кто пишет сценарии сложнее, чей код компилируется лучше и что выбрать: коммерческое API или open-source с установкой в своём контуре.

Реальные цифры, формальные метрики, субъективные ощущения команды. Всё в материале по ссылке.

Около минуты

30 июня 2025