История про сокращение счета за LLM на 80% — это не лайфхак и не удачное совпадение. Это симптом более глубокой проблемы: мы выбираем языковые модели так же, как когда-то выбирали VPS — «возьму самый популярный и побольше». В 2026 году такой подход уже стоит реальных денег. Предприниматель из истории Карла Лори сделал то, что делают почти все:
он выбрал OpenAI GPT-5, потому что: И какое-то время всё было нормально. Пока счёт за API не превысил $1500 в месяц. 📌 Важный момент:
GPT-5 не плохой.
Он просто почти никогда не самый выгодный. 📊 GPQA, SWE-Bench, MATH, ARC-AGI, LM Arena — всё это полезно…
Но не для твоей задачи. Почему? 🧠 Бенчмарки измеряют абстрактный интеллект, а не: Модель может быть топ-1 в reasoning, но посредственной в поддержке покупателя (customer support).
И наоборот. 👉 Единственный честный бенчмарк — это твои реальные промпты. Карл описывает подход, который выглядит очевидным — но почти никто его не делает. 🗂 Берём живые примеры
Истории диалогов, настоящие запросы