Автоматизация в 2025-м - дорогие эксперименты, которые слишком часто не доживают до нормального продакшена и не возвращают вложения. В свежих исследованиях по корпоративному AI видно простой факт: заметный эффект на выручку или маржу получает меньшинство компаний. MIT фиксирует примерно 5% генеративных AI-пилотов с понятным вкладом в бизнес, остальные так и остались красивыми демо. Параллельно есть цифры о том, что до 70-85% проектов вокруг AI не выходят на стабильную эксплуатацию - идея хорошая, на слайдах всё блестит, а в реальной работе не взлетает.
McDonald's с голосовым AI в драв-тру, MD Anderson с Watson и Telefónica O2 с RPA играли не в стартап на кухне: там и бюджеты с шестью нулями, и серьёзные вендоры, и свои команды внедрения. В итоге у одних - вирусные ролики в TikTok с беконом на мороженом, у других - онкопроект на десятки миллионов, который так и не попал в руки врачей.
С вами Filonov.Tech и в этой серии статей я разберу такие истории без мотивационных речей: где именно всё пошло боком и что бы я сделал по-другому, чтобы слабые пилоты умирали за недели, а не за годы через слезы и слитые бюджеты.
Цифры холодного душа
Первая статья в серии - специально без вдохновляющих лозунгов, только цифры и устройство провалов. Если собрать разные исследования в одну картинку, получается примерно следующее:
- Около 5% корпоративных генAI-пилотов дают заметный рост доходов, оставшиеся 95% не показывают нормального эффекта на P&L.
- По разным данным до 70-85% AI-проектов так и не доходят до устойчивого продакшена: часть гаснет на стадии пилота, часть ломается при попытке интеграции с боевыми системами.
- В 2025 году примерно 42% компаний уже откатили назад значимую долю своих AI-инициатив - ожидания не сошлись с реальностью, поддержка оказалась дороже, чем обещали на презентации.
Речь не только о бедных стартапах с кривыми руками. MD Anderson потратила больше 60 миллионов долларов на связку с Watson, пока аудиторы не зафиксировали, что цели не достигнуты, а система не встроена в работу врачей. Watson Health в целом обошёлся IBM в миллиарды, а потом направление продали с ощутимыми потерями - хороший маркер того, насколько сильно реальные внедрения отстали от маркетинга.
Где всё ломается ?
Самое неприятное в этих кейсах - чаще всего дело не в кривом разработчике, а в том, как поставлена задача и как устроен контур вокруг автоматизации. Если пройтись по разборам провальных проектов, всплывает один и тот же набор:
Размытая постановка задачи. Вместо чёткой цели «сократить время поиска протоколов с 20 до 3 минут» стартуют со слов «сделать умного помощника для онкологов».
Инструмент по хайпу. ГенAI прилепляют туда, где хватает простой логики и API, а RPA используют как костыль поверх хрупкого UI, не трогая сам процесс.
Нормальной работы с людьми нет. Врачей, операторов и бухгалтеров ставят перед фактом: «теперь вы работаете с Watson/ботом/роботом», не объясняя, что именно для них станет проще.
Ожидания уровня волшебной коробки. Сыроватым моделям сразу доверяют задачи вроде «второе мнение по онкологии», вместо того чтобы сначала закрыть безопасные вспомогательные штуки.
В истории MD Anderson всё сложилось вместе: система так и не стала частью реального рабочего потока врачей, а переход клиники на другую медицинскую информационную систему оставил Watson без нормального доступа к данным. Проект официально признали не соответствующим целям, хотя на входе были и бренд, и деньги, и громкий технологический партнёр.
Правило двух недель вместо пилотов на ИВЛ
Отдельная боль - пилоты, которые никто не решается отключить. Формально они живы, по отчётам «проходят оптимизацию», но по факту пользователи давно вернулись в Excel, интеграции загнивают, а команда поддержки тратит время на подлатку чего-то, что уже не вернёт свои деньги.
Чтобы не плодить такие зомби-сценарии, удобно с самого начала зашить жёсткие правила. В моём случае грубая, но работающая версия «правила двух недель»:
До старта фиксируются 2-3 понятных метрики: время обработки, доля автоматизированных шагов, стабильность, ошибки и т.п.
Пилот живёт ограниченный срок - порядка 14 дней на реальном, но контролируемом потоке, где падения не убивают бизнес.
Если за это время система не подбирается хотя бы к 70-80% ожидаемой пользы по этим метрикам, не начинаются долгие «давайте ещё немного подкрутим», сценарий останавливается или радикально пересобирается.
У MD Anderson всё было ровно наоборот: проект тянули годами, успели несколько раз сместить фокус, параллельно изменилась основная медицинская система, и в какой-то момент стало очевидно, что результат не соответствует ни целям, ни вложениям. Если бы там изначально стоял жёсткий ограниченный пилот с чётким «стопом», счёт вряд ли вырос бы до десятков миллионов.
Витрина успехов против зомби-автоматизаций
Снаружи всё выглядит красиво: презентации с кейсами, где AI улучшил показатели, сократил затраты и всех спас. В реальной жизни рядом обычно живёт другой мир - скрипты, боты и интеграции без нормального мониторинга, которые годами висят где-то в фоне и периодически стреляют себе в ногу.
Самый неприятный сценарий - не когда пилот честно закрыли, а когда про него забыли. В логистике выливается в неверные заказы и ручные допересчёты, в финансах - в странные проводки, в медицине - в тотальное недоверие ко всем следующим цифровым инициативам после первого громкого провала. В следующих частях серии разберу McDonald's, Watson и O2 уже по косточкам: где именно нужен был жёсткий выключатель, какие метрики надо было смотреть с первого дня и как можно построить пилоты так, чтобы они либо быстро выстреливали, либо так же быстро и без истерик умирали.
Дальше, будет только интересней. Оставайся со мной и следи за новыми публикациями из этой серии статей.