Найти в Дзене
FX

Как интернет-магазину экономить с помощью ИИ

Оглавление

В ход пошёл тяжёлый люкс: в этот раз речь пойдёт не о принципе «Написал промт — и вуаля, сократил кучу времени».

Будем говорить про интеграцию и обучение модели Gemma 3 4B.

1. Немного контекста

В одном интернет-магазине карточки товаров создавались вручную: Excel от поставщиков, генерация текста, SEO, форматирование, публикация. Процессом занимались 4 контент-менеджера. В среднем — 40 минут на одну карточку. В месяц — 500 новых SKU.

Что это значило в деньгах:

– Средняя зарплата: 80 000 рублей на сотрудника

– Общий ФОТ: 4 × 80 000 = 320 000 рублей в месяц

– Загруженность на карточки: около 65%

→ Только на карточки уходило: 208 000 рублей в месяц

→ В год — 2 496 000 рублей

К этому добавлялись:

– простои и правки

– ошибки (до 15 % карточек возвращались на доработку)

– текучесть (обучение новых сотрудников)

– непроизводительное время (созвоны, согласования)

С учётом всего — итоговая годовая стоимость задачи составила около 2,7 млн рублей.

2. Что сделали

Вместо масштабирования штата приняли решение внедрить GenAI. Не подписку на GPT, а локальное решение, встроенное в процесс.

Цель:

– убрать рутину

– ускорить цикл вывода карточек

– снизить стоимость

– сохранить контроль над данными (SKU, ценообразование, поставщики)

3. Текущее состояние (AS IS)

– 500 карточек в месяц

– 40 минут на одну карточку

– ФОТ команды: 320 000 рублей

– Загрузка на задачу: 65 %

– Прямые издержки: 208 000 рублей в месяц

– Полные годовые издержки: 2 700 000 рублей

4. Целевое состояние (TO BE)

– Excel или JSON с параметрами → GenAI → 2–3 варианта текста

– Верификация и публикация: 1 человек, 0,3 ставки

– Среднее время на карточку: 2 минуты

– Производительность: 500 карточек в день на одного сотрудника

– Уникальность: 85–95 %

– Ошибки: менее 3 %

– Новая стоимость одной карточки: 62 рубля (вместо 416)

-2

5. Почему выбрана Gemma 3 4B

Рассматривались 3 сценария:

  1. ChatGPT API: дешево (около 30 долларов в год), но нет контроля, RAG, SLA
  2. DeepSeek R1: мощно, но требует RTX 3090 и fine-tuning
  3. Gemma 3 4B: оптимальный баланс

Аргументы в пользу Gemma 3 4B:

– открытая, бесплатная, локальная модель

– лучший русскоязычный токенизатор

– быстрый инференс: до 10 токенов в секунду

– стабильно работает на RTX 3060

– интегрируется в пайплайн, а не в UI

– не зависит от VPN, API и токенов

При росте объёма можно перейти на Gemma 12B или DeepSeek R1 на той же инфраструктуре (3090 или 2×A10).

6. Оборудование и затраты

Нагрузка:

– 500 карточек × ~1000 токенов = 500 000 токенов в месяц

– Генерация одной карточки — менее 2 секунд

– Модель справляется на одном RTX 3060

Железо:

– GPU: RTX 3060

– CPU: i5

– RAM: 32 ГБ

– SSD: 1 ТБ

– DevOps + сборка

Стоимость: 133 000 рублей

-3

CAPEX (разово):

– Сервер и железо: 133 000 рублей

– Интеграция с CMS и API: 50 000 рублей

– Промт-инжиниринг и пайплайн: 70 000 рублей

– Обучение команды: 20 000 рублей

– Резерв: 30 000 рублей

Итого: 303 000 рублей

OPEX (в год):

– Поддержка и обновления: 60 000 рублей

– Электроэнергия: 9 600 рублей

– Резервы: 20 000 рублей

Итого: 89 600 рублей

-4

7. Экономика и эффект

До внедрения:

– 2 700 000 рублей в год

После внедрения:

– ФОТ: 288 000 рублей в год (1 человек × 0,3 ставки)

– OPEX: 89 600 рублей

– Совокупно: 377 600 рублей

Годовая экономия: 2 322 400 рублей

Чистый эффект с учётом CAPEX: 2 019 400 рублей

Окупаемость: менее 2 месяцев

ROI за первый год: более 660 %

8. Что получилось

– Снижение затрат на 6,7 раза

– Рост производительности на 25 раз

– Время на карточку: с 40 до 2 минут

– Ошибки: с 15 % до менее 3 %

– Уникальность: с 40–60 % до 85–95 %

– Полный контроль над процессом, масштабируемость, автономность

-5

Вывод

Компания, которая тратила миллионы на ручной текст, за 4 недели построила собственный GenAI-модуль, запущенный внутри процессов и не зависящий от облачных провайдеров. Это не MVP, не эксперимент, а зрелый продукт, с чёткой окупаемостью, измеримым эффектом и бизнес-моделью, которую можно масштабировать.

👉Подпишись на Telegram-канал FX👈

FX

Кейсы применения ИИ в работе.

Цифры, эффекты, визуализация.

Для тех, кто считает результат.

Кейсы | эффекты | визуализация