4 подписчика

Сравнение DeepSeek v4 Pro и GPT-5.5⁠

24 апреля24 апр

1 мин

Как отличается эффективная стоимость моделей при работе через кодинг-агента. По расчётам получилось, что GPT-5.4 примерно вдвое дороже большой DeepSeek v4 Pro, а GPT-5.5 — примерно в четыре раза! Но сравнивать только цену здесь не совсем корректно. Важно ещё учитывать, сколько токенов модели тратят на рассуждения и путь к результату. У OpenAI с этим обычно лучше: им часто нужно меньше токенов, чтобы прийти к такому же или более сильному решению Сейчас нормально сравнить это можно, по сути, только на TerminalBench 2.0. Обе компании показывали графики, где по горизонтали — количество токенов, а по вертикали — качество Например, GPT-5.5 выходит на 75% примерно за 7 тысяч токенов. DeepSeek v4 Pro для 68% нужно около 50 тысяч Правда, тут есть нюанс. Не факт, что на графиках токены считаются одинаково. У DeepSeek ось подписана как «Total Tokens», а значит, туда могли попасть не только рассуждения модели, но и описание задачи, и вывод терминала. Хотя DeepSeek-V3.2 тоже показывает неплохой рез

Но сравнивать только цену здесь не совсем корректно. Важно ещё учитывать, сколько токенов модели тратят на рассуждения и путь к результату. У OpenAI с этим обычно лучше: им часто нужно меньше токенов, чтобы прийти к такому же или более сильному решению

Сейчас нормально сравнить это можно, по сути, только на TerminalBench 2.0. Обе компании показывали графики, где по горизонтали — количество токенов, а по вертикали — качество

Например, GPT-5.5 выходит на 75% примерно за 7 тысяч токенов. DeepSeek v4 Pro для 68% нужно около 50 тысяч

Правда, тут есть нюанс. Не факт, что на графиках токены считаются одинаково. У DeepSeek ось подписана как «Total Tokens», а значит, туда могли попасть не только рассуждения модели, но и описание задачи, и вывод терминала. Хотя DeepSeek-V3.2 тоже показывает неплохой результат уже на 10–15 тысячах токенов

Поэтому какая-то разница в эффективности, скорее всего, есть. Но в 7 раз — вряд ли

Для более точной картины стоит дождаться замеров от Artificial Analysis и других бенчмарков, где отдельно смотрят не только качество, но и эффективность

И ещё один момент: DeepSeek обычно медленнее генерирует токены. Поэтому на практике разница может ощущаться не только в стоимости, но и во времени решения задачи — иногда сильнее, чем кажется по таблице

Мой телеграм канал Хак Так: https://t.me/Xak_Tak ⬅ подпишитесь, чтобы не пропустить все самое важное!