Добавить в корзинуПозвонить
Найти в Дзене
Не ИИ мозги

AI КОМП-АС фреймворк - разбор по полочкам. А: Архитектурно-продуктовый дизайн AI решения

Ваша AI инициатива требует разработки и внедрения своего кастомизированного решения? → В сегодняшней статье разбираем подход к формированию архитектурно-продуктового дизайна AI сервисов, позволяющий снизить риски «войти не в ту дверь» и разработать продукт с контролируемой возвратностью инвестиций, отвечающий вашим целям. На предыдущем этапе фреймворка мы приоритезировали все инициативы в рамках процесса AI трансформации, свели воедино все за и против, очертили дорожную карту - что называется, семь раз отмеряли. Можем ли резать? Когда мы говорим про разработку ПО, то речь идет о процессе с высокой степенью нелинейности, когда мы говорим про разработку AI решений и других вероятностных решений, то здесь уже нелинейность, возведенная в степень. Соответственно проектно-строительный подход здесь, увы, уже не работает и мерять приходится не семь раз, а от забора и до заката. Чтобы быть уверенным, что построенное нами решение даст требуемый результат, нам необходимо будет протестировать сфор
Оглавление

Ваша AI инициатива требует разработки и внедрения своего кастомизированного решения? → В сегодняшней статье разбираем подход к формированию архитектурно-продуктового дизайна AI сервисов, позволяющий снизить риски «войти не в ту дверь» и разработать продукт с контролируемой возвратностью инвестиций, отвечающий вашим целям.

На предыдущем этапе фреймворка мы приоритезировали все инициативы в рамках процесса AI трансформации, свели воедино все за и против, очертили дорожную карту - что называется, семь раз отмеряли. Можем ли резать?

Когда мы говорим про разработку ПО, то речь идет о процессе с высокой степенью нелинейности, когда мы говорим про разработку AI решений и других вероятностных решений, то здесь уже нелинейность, возведенная в степень. Соответственно проектно-строительный подход здесь, увы, уже не работает и мерять приходится не семь раз, а от забора и до заката.

Чтобы быть уверенным, что построенное нами решение даст требуемый результат, нам необходимо будет протестировать сформулированные бизнес-гипотезы, очертить функциональные и нефункциональные требования и ограничения для нашей задачи, спроектировать продуктовый и архитектурно-технический дизайн решения, оценить риски, рассчитать стоимость владения итоговым продуктом. Для ответа на эти вопросы мы рекомендуем формировать PRD - Product Requirements Document или, если выражаться по-современному, в «а ля рюс» стиле, ДТП - Документ с Требованиями к Продукту. И здесь наконец-то мы можем найти что-то общее с классической стройкой - как ни одно строительство не начинается без технического проекта и сметы, так и не одна AI разработка не обходится без PRD и архитектурно-продуктового дизайна.

Давайте ж разберем ключевые составляющие этого «зелья».

-2

Product Requirement Document

Product Requirement Document (PRD) - это простой вернеуровневый документ, объясняющий Что должно быть реализовано, Как это должно работать и Зачем это нужно. Имея такой вижен, команда точно понимает, что она «строит», и может осознанно и эффективно принимать решения в ходе процесса разработки и внедрения.

Начнем с ответа на вопрос Зачем?

Описываем бизнес-гипотезу и связанные бизнес-метрики

Рекомендуем детально описать бизнес-гипотезу и привести бизнес-метрики, на которые окажет влияние наше решение в случае, если будет реализовано. В случае, если бизнес-метрики слишком высокоуровневые и непосредственное влияние решения прослеживается сложно, то необходимо произвести их декомпозицию, выделив составные компоненты. На М-этапе( GAP-анализ) AI КОМП-АС фреймворка мы проделывали уже схожее упражнение - декомпозировали бизнес-метрики, чтобы «смапить» их c процессами организации. На данном этапе возможно придется сделать еще один шаг декомпозиции, выделив еще один уровень под-метрик.

Разберем на примере:

Допустим исходная бизнес гипотеза состоит в том, чтобы добиться роста ежемесячного регулярного дохода на 10%( MRR growth = 10%).

На этапе GAP анализа была проведена деомпозиция и исходная метрика была разложена на составные части:

MRR Growth = (New MRR + Expansion MRR) – (Contraction MRR + Churned MRR)

Допустим разрабатываемое AI решение позволят организации оптимизировать конверсию лидов, помогая с переходом от триала в платные подписки. Для выделения метрики, что один в один соответствует этой задаче нам необходимо двинуться дальше и провести декмопозицию под-метрики New MRR:

New MRR = (# of qualified leads) × (lead‑to‑trial conversion rate) × (trial‑to‑paid conversion rate) × (average initial contract value)

Таким образом, мы выделили целевую под-метрику trial‑to‑paid conversion rate, путем отслеживания которой мы напрямую сможем проверить гипотезу, связанную с данным AI решением.

А теперь к тому, Что мы строим?

Описываем продуктовый дизайн и пользовательские сценарии

Пример USM - User Stories Mapping
Пример USM - User Stories Mapping

Готовим продуктовый бэклог, описывая функциональные требования к решению в виде пользовательских историй (User Stories).

Для осмысления общей картины вашего решния и облегчения приоритезации также рекомендую провести User Stories Mapping - это подход, который позволяет получить полную, но при этом простую картину функциональности продукта в разрезе пользовательских сценариев, следующих в порядке их выполнения. Такая картина поможет вашей команде разработки определить очередность того, что реализовывать первым, а что отложить до поздних релизов. Подход описан вдоль и поперек (например, тут), поэтому не буду вдаваться в его детализацию.

При необходимости, если решение получается сложносоставным, рекомендуем также выделить Minimal Viable Product - минимальную жизнеспособную версию решения, внедрение которой несет значимую ценность для пользователя, но при этом не требует реализации всех «фуинкциональных фич». Это те условные 20% решения, что несут 80% ценности.

Стараемся учесть специфику AI решений - любая современная модель начинает постепенно деградировать сразу же после ее деплоя, не может быть на 100% избавлена от галлюцинаций, дрифта данных, не можеть принимать решения в неизвестности, т.е. не готова к полной передаче ответственности за результат автоматизируемого бизнес-процесса:

Проектируя решение, сохраняйте присутствие человека в цепочке принятия решений, как минимум в критичных точках процесса, чтобы при неопределенности система могла возвращать управление ответственному сотруднику (Human in the Loop). Ответственность за результат лежит на пользователе AI решения. не на системе. AI инструменты - это как электрический рубанок в руке столяра вместо обычного, и выйдет ли в итоге идеальный или кривой-косой продукт, зависит исключительно от умений самого столяра.
Ваше решение в идеале должно предусматривать
встроенный контур обратной связи (ОС) со стороны пользователя. Запрос ОС может быть явным для пользователя или может быть реализован косвенно путем сбора и анализа логов, где ведется трекинг пользовательских действий и можно определить рекацию на предложенные моделью ответы.

Разобравшись, что мы хотим строить, давайте теперь решим, Как это делать!

Пример С2 схемы
Пример С2 схемы

При описании архитектуры решения рекомендуем использовать C4 нотацию - в деталях познакомиться с ней можно, например, здесь.

С4 нотация подразделяется на 4 уровня абстракции: C1 - Context (Контекст), С2 - Containers (Контейнеры), С3 - Components (Компоненты), С4 - Code (Код). Такое деление позволяет всем сторонам, участвующим в имплементации AI ининциативы, обсуждать создаваемое решение, говоря на одном языке и синхронизироваться в понимании того, что будет реализовано. Так, например, архитектурная схема уровня C1( Контекст системы) позволяет эффективно вовлекать в обсуждение решения бизнес, сохраняя суть и не перегружая их излишними техническими деталями. Тогда как уровень абстракции С4( Код) уже дает возможность эффективной коммуникации непосредственно с командой разработки, обеспечивая погружение до уровня кода и реализации конкретных атомарных блоков архитектурного концепта и тех. дизайна.

Ниже подсвечу ключевые принципы, которыми рекомендуем руководствоваться при проектировании ваших AI сервисов:

Используейте минимально-достаточные инструменты для решения конкретной задачи, ставя конечную стоимость вашего решения выше технологической новизны. Старайтесь избегать использования тяжеловесных моделей и монструозных API - высокая стоимость инференса и соответственно высокая стоимость владения( Total Cost of Ownership, TCO) негативно скажутся на возвратности инвестиций в создаваемый сервис, в худшем сценарии превышая те экономический эффекты, которые вы ожидаете от внедрения вашей инициативы.
Качество данных на входе определяют качество информации на выходе. Главная составляющая успеха AI решения не столько в выбранной fancy модели, сколько в качественно подготовленных и доставленных до нее данных. При проектировании архитектуры уделяйте особое внимание интеграциям с источниками данных и data-пайплайнам. Инвестиции в надежную инфраструктуру процессинга данных (брокеры сообщений, кэширование, валидация на лету) радикально снижают стоимость поддержки и убирают скрытые убытки от принятия решений на устаревших или «битых» данных.

Описываем и приоритезируем метрики решения

Определитесь, какая именно ML задача вами решается - разрабатываете ли вы классифиактор или это задача на регрессию? Отталкиваясь от типа создаваемого решения и ориентируясь на отраслевый стандарты и лучшие практики вы сможете подобрать целевые AI метрики.

Определитесь с бейзлайном, с которым вы будете сравнивать ваше решение. Например, для этого вы можете оценить по выбранным метрикам работу в рамках текущего, не автоматизированного процесса.

Учитывайте контекст решаемой проблемы. К примеру, насколько высока толернатность к ошибке. Скажем, если вы решаете проблему оттока клиентов путем автоматизации предлагаемой им скидки на ваш продукт, то false positive результат( предложение скидки не собирающемуся уходить клиенту) может быть вполне приемлемым и не слишком дорогим итогом, тогда как false negative( упущенный клиент) итог может быть довольно болезненным.

Описываем инфраструктуру

Для того, чтобы сделать осознанный выбор в части инфраструктуры, необходимо оценить, как целевые требования, предъявляемые к вашему решению, так и экономику, а также текущие и будущие ограничения для работы сервиса. Условно, чтобы определиться, двигаться ли вас с облаком или разворачивать on-premise постарайтесь ответить на вопросы ниже:

есть ли у вас собственный свободные мощности( GPU)?
есть ли настроенная MLOps инфраструктура?
есть ли техническая команда, готовая взять «на баланс» ваше решение?
какова предполагаемая нагрузкана решение(RPS, DAU, нагрузка в пике)?
какой SLA и требования к доступности?
какие требования к безопасности со стороны ИБ? ( неизбежен ли закрытый контур или нет)
какие требования со стороны комплаенса? (например, исполнение 152-ФЗ)
какие временные ограничения в рамках вашей инициативы? ( требуется показать быстрые эффекты, нет времени на формирование собственной инфры)
какие бюджетные ограничения в рамках вашей инициативы?

Облако может обеспечить быстрый старт, но может быть дорогостоящим при росте нагрузки; on-premise развертывание дает условно бесплатный инференс и снижение OPEX-а, но ресурсозатратно в плане сетапа - все инфраструктурные опции имеют свои плюсы, свои минусы, для принятия решения важно понять, что будет рабочей опцией именно для вас.

Описываем риски

Шаблон карты рисков
Шаблон карты рисков

Описываем архитектурный дизайн

Составляем карту рисков, относящуюся к процессу разработки и внедрения спроектированного решения. Перечисляем, как технические риски, так и те, что связаны с достижением бизнес эффектов, организационными и регуляторными трудностями.

Для каждого риска стараемся оценить его импакт в контексте вашей инициативы и вероятность его реализации, а также по возможности формируем потенциальные план, позволяющий данный риск исключить или же митигировать. В точке не всегда возможно оценить импакт от риска в рублях или посчитать вероятность его реализации в процентах, поэтому рекомендуем карту рисков формировать, используя низко-гранулярную градацию, деля их по вероятности и влиянию на низкие, средние и высокие.

План разработки и внедрения

Пример диаграммы Ганта
Пример диаграммы Ганта

Формируем гипотезы

На данном шаге в первую очередь фокусируемся на отработке карты рисков, сопряженных с разработкой решения: если у вас есть риски в квадрате с высоким импактом и высокой вероятностью, то рекомендуем обратить на них особое внимание и сформировать на основании шагов по митигированию гипотезы, проверка которых позволит убедиться в реальности указанного риска и протестировать решение, позволяющее этим рисков управлять.

Для тестирования сформированной гипотезы рекомендуем запускать отдельную небольшую PoC фазу( Proof of Concept), предворяющую запуск основного проекта - цель этой фазы не в построении полноценного решения, а именно в проверке вашей гипотезы минимально возможными средствами.

В случае, если вы получили большое число гипотез требующих запуска PoC этапов или единый, но весьма объемный PoC этап, то возможно вам стоит сделать шаг назад и еще раз проанализировать ваш список AI инициатив и дорожную карту. На шаге П - прокладываем путь AI КОМП-АС фреймворка мы рекомендовали деприоритезировать те инициативы, что имеют низкую достижимость и высокие риски. Возможно та инициативы, для которой сейчас вы проектируете решение на этапе составления дорожной карты была недостаточно точно оценена в плане реализуемости.

Формируем план

Исходя из получившегося набора гипотез, требующих проверки в рамках PoC, очерченного минимального продукта( MVP) и итогового видения полноценного решения( Production Ready) нам предстоит сформировать итеративный план разработки и внедрения для нашей AI инициативы.

Для этого каждый из этапов - PoC, MVP, Production Ready - мы должны оценить с точки зрения требуемых ресурсов, а именно требуемой команды и трудоемкости этапа, требуемой инфраструктуры, требуемых данных и т.д. и выделить зависимости, если таковые есть.

Имея данную инфомрацию мы сможем уже сформировать план разработки и внедрения решения, визуализировав его, например, в виде диаграммы Ганта.

Оцениваем расходы и рассчитываем TCO

Наконец-от мы на финишной кривой - здесь ам предстоит оценить получившийся план разработки и внедрения в твердой валюте, конвертируя все ресурсные и временные затраты в рубли.

Определяем, каковы будут капитальные затраты (CAPEX) на создание нашего решения - сюда будет входить стоимость проверки гипотез, часы на разработку версий вашего сервиса, в случае, если вы двигаетесь с развертыванием On-premise, смотимость требуемых вычислительных мощностей.

Определяем, каковы будут операционные затраты (OPEX), сопровождающие работу вашего решения на горизонте года - сюда будет входить стоимость мониторинга, обслуживания, обучение команды, инцидент-менеджмент, в случае, если вы выбрали путь использования облачных провайдеров, сюда же попадет стоимость инференса моделей.

Далее исходя из продолжительности жизненного цикла вышей инициативы и сроков стратегического плана вашей организации, вы можете посчитать полную стоимость владения (TCO)

TCO = CAPEX + OPEX x Timeline,

здесь Timeline - количество лет эксплуатации решения.

Имею прогнозный экономический эффект и полную стоимость владения вы уже сможете получить величину ROI и рассчитать сроки возвратности инвестиций, а соответственно взвешенно принять решение о запуске вашей иницитивы в непосредственную разработку.

Заключение

Итак описанный выше подход к архитектурно‑продуктовому дизайну AI‑решений позволяет уйти от концепции «чёрного ящика» в пользу осознанного, управляемого процесса. На каждом этапе мы даём однозначные ответы на четыре ключевых вопроса:

Зачем? — через декомпозицию бинес-гипотез и метрик, связывая AI‑инициативу с конкретными измеримыми эффектами.
Что? — через продуктовый дизайн, пользовательские сценарии и принцип Human‑in‑the‑Loop, исключающий «просадки» решения в случае высокой неопределённости.
Как? — через понтяно описанную архитектуру и выбор минимально достаточных инструментов, обеспечивающих прозрачность и контролируемость реализации.
Сколько стоит и что дает? — через оценку CAPEX, OPEX, расчёт TCO и ROI, превращающих экономику проекта из догадок в ответ и пищу для принятия решения.

В такой концепции внедрение AI не воспринимается как «прыжок веры» с одной стороны, с другой стороны не ожидается уже и какая-то «чудесная магия» от внедрения. В результате подхода мы возвращаемся в пространство взвешенных решений с понятными рисками, предсказуемой стоимостью владения и чётко измеряемой бизнес‑ценностью. Такой подход позволяет запускать разработку не «на надежде», а на твёрдых данных — с полным пониманием того, что, зачем и как мы строим, и во что это в конечном счёте обойдётся.

----------------

Делюсь опытом внедрения ИИ в бизнес через поиск максимальной ценности:

https://t.me/aibobok