Принципиальный инженер в крупном e-commerce. Месяц гонял всё через один режим - расход был на пределе. Разделил по типу задач - в три раза э

20 мая20 мая

6 мин

Меня зовут Костя, 40, principal engineer в крупном российском e-commerce (Иннополис, головной офис в Москве, в инжиниринге 1100 человек). Отвечаю за платёжный модуль и интеграции с банками- эквайерами и с системами быстрых платежей. В компании с лета 2022, до этого 8 лет в одной финтех-группе на близкой позиции. Жена Маша, 38, врач-педиатр в Иннополисской клинике, в декрете до сентября. Дочь Аня, 4, в саду «Звёздочка». В марте через корпоративную IT-программу мне дали подписку на NeuroVerdict - компания закупила 220 лицензий для инженеров от principal-уровня и выше. Раньше я пользовался ChatGPT Plus (оплачивал сам, 2400 рублей в месяц), плюс корпоративный GitHub Copilot для редактора. В первые три недели после получения доступа я попробовал NeuroVerdict как «второй ChatGPT». То есть открывал страницу, писал вопрос, читал ответ от пяти моделей. На любой вопрос. От «синтаксис asyncio.gather в Python» до «как мы будем мигрировать платёжный модуль с REST на event-driven через Kafka». К кон

Оглавление

Что я нашёл
Что я перестроил
Результаты за первые 12 дней

Жена Маша, 38, врач-педиатр в Иннополисской клинике, в декрете до сентября. Дочь Аня, 4, в саду «Звёздочка».

В марте через корпоративную IT-программу мне дали подписку на NeuroVerdict - компания закупила 220 лицензий для инженеров от principal-уровня и выше. Раньше я пользовался ChatGPT Plus (оплачивал сам, 2400 рублей в месяц), плюс корпоративный GitHub Copilot для редактора.

В первые три недели после получения доступа я попробовал NeuroVerdict как «второй ChatGPT». То есть открывал страницу, писал вопрос, читал ответ от пяти моделей. На любой вопрос. От «синтаксис asyncio.gather в Python» до «как мы будем мигрировать платёжный модуль с REST на event-driven через Kafka».

К концу третьей недели я зашёл в админ-панель посмотреть расход кредитов. По моему тарифу (Pro, 500 кредитов в месяц - это средний корпоративный) я уже использовал 487 за 3 недели. То есть к концу месяца я бы перерасходил минимум на 50-80 кредитов, а это означает докупку пакета или переход на Ultra.

В корпоративных подписках это не проблема для меня лично (платит компания), но это плохая практика - инженер должен экономить ресурсы там, где это легко. Особенно когда мне эту подписку выделили как часть IT-бюджета на год.

Сел разбираться. Открыл документацию NeuroVerdict.

Что я нашёл

Оказалось, в сервисе три режима, я по умолчанию работал в Standard. Спецификация:

Lite - одна модель (Grok), 1 кредит за запрос. Время ответа 4-7 секунд. Подходит для однозначных задач: справка по библиотеке, объяснение синтаксиса, простая отладка лога, переписать SQL-запрос по понятной задаче.

Standard - пять моделей одновременно (ChatGPT, Gemini, Perplexity, Claude, Grok) + модератор-синтез, 6-7 кредитов. Время ответа 12-25 секунд. Подходит для задач с разными возможными подходами: обзор архитектурных решений, выбор технологии, code review с нюансами, аналитика данных.

Deep - два прохода со sanity check между ними, 13-15 кредитов. Время ответа 35-60 секунд. Подходит для критичных архитектурных решений: миграции, выбор технологического стека на 3-5 лет, оценка сложных trade-offs.

Я по факту все 3 недели использовал Standard на ВСЕ свои запросы. То есть на «как написать gather» я получал ответ 5 моделей + синтез за 20 секунд и за 7 кредитов. Это перебор на 80% моих запросов.

Что я перестроил

С 6 мая я разделил по типам задач. Завёл себе ментальное правило: до запроса задаю один вопрос - «мне нужна одна точка зрения или пять разных».

Lite (одна модель) - на 80% задач:

«Объясни этот трассировочный лог из nginx»
«Синтаксис map_async в библиотеке pytest-asyncio»
«Перепиши этот SQL так, чтобы избежать N+1»
«Что значит эта warning от kubelet»
«Как замокать grpc-handler в Go-тестах»
«Найди ошибку в этом regexp»

Все эти задачи имеют один правильный ответ. 5 моделей дадут одно и то же с минимальными вариациями. Lite даёт ответ за 5 секунд и 1 кредит. Раньше я ждал 20 секунд и тратил 7 кредитов на то же.

Standard (5 моделей + синтез) - на 15% задач:

«Сравнить Kafka и NATS для нашей нагрузки (10к сообщений/сек пиковой)»
«Code review сложного миграционного скрипта - где могут быть тонкости»
«Анализ нашей метрики latency - почему растёт P99 в часы пик»
«Какой подход к идемпотентности запросов в платёжном API»

На эти задачи у разных моделей разные углы. ChatGPT даёт стандарт индустрии, Gemini другой подход, Perplexity со ссылками на блоги профильных компаний, Claude акцент на trade-offs, Grok часто бросает неочевидный аргумент. Синтез собирает в один читаемый ответ. Время 20 секунд, 7 кредитов - оправдано задачей.

Deep (два прохода) - на 5% задач:

«Миграция платёжного модуля с REST на event-driven через Kafka - стратегия, риски, что выкатывать первой»
«Выбор технологии распределённого кеша на следующие 3-5 лет (Redis vs DragonflyDB vs KeyDB) с учётом нашего масштаба»
«Оценка trade-offs перехода на gRPC между микросервисами»
«Архитектура передачи персональных данных в новой 152-ФЗ редакции 2026 - что меняется»

На эти задачи я хочу не просто 5 ответов с синтезом, а пере- проверку самого синтеза вторым проходом. Время 50 секунд, 15 кредитов - тоже оправдано (это решения на годы вперёд, цена ошибки высока).

Результаты за первые 12 дней

С 6 по 17 мая (12 календарных дней, 8 рабочих) разложил расход кредитов.

В Lite-режиме сделал 68 запросов, потратил 68 кредитов. Это 79% по числу запросов, 34% по бюджету. Раньше эти же запросы в Standard съели бы 476 кредитов (по 7 за каждый).

В Standard-режиме сделал 15 запросов, потратил 96 кредитов (средний 6.4 за запрос). Это 17% по числу запросов, 48% по бюджету.

В Deep-режиме сделал 3 запроса, потратил 36 кредитов (средний 12). Это 4% по числу запросов, 18% по бюджету.

Итого за 12 дней: 86 запросов, 200 кредитов. Прогноз на полный месяц - 460-490 кредитов, под лимит 500 уложусь с запасом.

Раньше эти же 86 запросов через Standard стоили бы около 600 кредитов уже за 12 дней - в проекции на месяц это 1300-1400, почти втрое больше моего месячного лимита. Пришлось бы докупать пакеты или переходить на Ultra-тариф.

Экономия 65% от бюджета. Скорость на простых задачах (которых 80%) в 4 раза выше (Lite-ответ за 5 сек вместо Standard 20 сек).

Что я для себя выписал

Я инженер. Я по работе оптимизирую системы. Я по личной привычке ленив в оптимизации своих рабочих инструментов - использую то, что один раз настроил, и не пересматриваю. Когда мне поставили лимит на NeuroVerdict - я только тогда сел и разбирался.

Главная переключка - до запроса я задаю себе один вопрос: «мне нужна одна точка зрения или пять разных?». Если одна (правильный ответ известен) - Lite, быстрее и дешевле. Если пять (есть альтернативные подходы) - Standard. Если критическое решение - Deep.

Это не сложно. Это один лишний вопрос на 3 секунды перед каждым запросом. И этот вопрос экономит 65% бюджета и в 4 раза ускоряет 80% работы.

С Машей в субботу за ужином я ей рассказал. Она спросила «а ты сам ChatGPT Plus теперь оставишь или отменишь?». Я подумал. Отменил. Лично платить 2400 ежемесячно за то, что у меня и так есть в корпоративной подписке (плюс ещё 4 модели рядом + синтез) - избыточно. С июня живу на одном инструменте.

Расход моих 2400 в месяц теперь пойдёт на занятия Ани в музыкальной школе. Она с июня записана в группу раннего развития, будет играть на маленьком ксилофоне. Маша смеётся - «Костя, ты у меня экономист пары не вынес, а тут оптимизировал на полный кружок».

CTO Дима, увидев мои метрики за первую неделю (он смотрит расходы по всем 220 лицензиям), на нашем еженедельном 1:1 в среду 13 мая спросил: «Костя, ты как-то очень экономно стал использовать. Что-то изменилось?». Я рассказал про переключку по типам задач. Дима в четверг сделал внутреннюю рассылку всем 220 подписчикам про три режима с моим кейсом как примером. Ожидаем, что если хотя бы треть команды повторит мою практику - общий расход компании по подписке упадёт на 30-40%, и за бюджет получится подключить ещё 60-80 инженеров. Через месяц увижу реальные цифры.

Кто читает это для себя

Если у вас сейчас есть подписка на NeuroVerdict или другой инструмент с разными режимами - проверьте за один день, как вы их используете. Если всё через один универсальный режим (как я первый месяц) - вы переплачиваете и теряете скорость на простых задачах.

Не нужно перечитывать всю документацию. Достаточно одной таблички в голове:

Однозначный ответ есть? Lite.
Нужны разные углы? Standard.
Решение на годы? Deep.

Это 30 секунд переключки перед каждым запросом. Эта 30-секундная привычка у меня сэкономила 65% бюджета и компании в целом позволила перевести 80 коллег на ту же подписку без новых трат.

Маленькая инженерная оптимизация. Дёшево измеряется в кредитах, дорого читается как «понял, как работает мой инструмент».