Найти в Дзене
ProAi

Марш девяток: Андрей Карпати объяснил, почему 90% надежности нейросетей — это почти провал

Представьте: вы смотрите демо новой нейронки, и она круто срабатывает в 9 из 10 случаев. Кажется, что успех в кармане? Но Андрей Карпати считает иначе. Его концепция «Марш девяток» говорит о том, что путь от 90% до 99.99% надежности — это не просто полировка, а адский труд, где каждая новая девятка требует столько же усилий, сколько вся предыдущая работа. Почему это важно? Потому что в бизнесе разница между «обычно работает» и «надежно как часы» определяет, внедрят технологию или выкинут на помойку. Вот что меня удивило: когда дело доходит до сложных цепочек действий, ошибки множатся. Представь, что в твоем рабочем процессе 10 шагов: понять запрос, найти данные, вызвать инструмент, проверить результат и так далее. Если каждый шаг надежен на 90%, то общая вероятность успеха всей цепочки падает до жалких 35%. Получается, что в 6 случаях из 10 система просто сломается. Ну, и зачем нам такой помощник? По результатам наблюдений, реальная «магия» софта корпоративного уровня начинается только
Оглавление
   Андрей Карпати объясняет концепцию Марш девяток: почему 90% надежности нейросетей недостаточно для бизнеса и как повысить стабильность ИИ до 99.99%.
Андрей Карпати объясняет концепцию Марш девяток: почему 90% надежности нейросетей недостаточно для бизнеса и как повысить стабильность ИИ до 99.99%.

Представьте: вы смотрите демо новой нейронки, и она круто срабатывает в 9 из 10 случаев. Кажется, что успех в кармане? Но Андрей Карпати считает иначе. Его концепция «Марш девяток» говорит о том, что путь от 90% до 99.99% надежности — это не просто полировка, а адский труд, где каждая новая девятка требует столько же усилий, сколько вся предыдущая работа. Почему это важно? Потому что в бизнесе разница между «обычно работает» и «надежно как часы» определяет, внедрят технологию или выкинут на помойку.

Математика против энтузиазма

Вот что меня удивило: когда дело доходит до сложных цепочек действий, ошибки множатся. Представь, что в твоем рабочем процессе 10 шагов: понять запрос, найти данные, вызвать инструмент, проверить результат и так далее. Если каждый шаг надежен на 90%, то общая вероятность успеха всей цепочки падает до жалких 35%. Получается, что в 6 случаях из 10 система просто сломается. Ну, и зачем нам такой помощник?

По результатам наблюдений, реальная «магия» софта корпоративного уровня начинается только на отметке 99.99%. В этом случае сбои случаются раз в три месяца, а не по пять раз на дню. Это и есть та дистанция, которую ИИ-индустрии еще только предстоит пройти.

Как выжимать эти самые девятки: практические советы

Чтобы превратить капризную нейронку в послушный инструмент, разработчики используют несколько хитрых приемов. Вот основные рычаги:

  • Ограничьте свободу: Вместо того чтобы давать ИИ полную волю, его загоняют в жесткие рамки графа состояний. Каждый шаг имеет свои лимиты по времени и количеству попыток.
  • Проверка контрактов: Большинство сбоев происходит из-за кривого формата данных. Строгая валидация JSON на входе и выходе спасает от «галлюцинаций» и странных символов.
  • Уровни защиты: Нужно проверять не только синтаксис, но и бизнес-логику. Имеет ли право бот одобрять скидку в 90%? Если уверенность системы низкая, лучше отправить задачу на проверку человеку.
  • Инструменты как в ИТ: К вызовам API и базам данных нужно относиться серьезно: ставить таймауты, использовать повторы и следить за версиями схем, чтобы ничего не «отвалилось» молча.

Безопасный «слайдер» автономности

Кстати, один из крутых подходов — это воспринимать автономность ИИ не как переключатель «вкл/выкл», а как регулятор громкости. В начале стоит оставить системе только право на чтение или обратимые действия. А вот реальные изменения в базе или отправку денег лучше заблокировать до подтверждения человеком. В коде это выглядит примерно так (упрощенно):

def run_step(name, attempt_fn, validate_fn):
for attempt in range(1, 4):
try:
out = attempt_fn()
validate_fn(out)
return out
except:
sleep(jittered_backoff(attempt))
return EscalateToHuman()

Почему бизнесу это нужно именно сейчас?

По данным исследований McKinsey за 2025 год, больше половины компаний, внедривших ИИ, уже столкнулись с негативными последствиями. Чаще всего это банальные неточности. В итоге доверие падает, а бюджеты замораживаются. Вывод простой: надежность — это не скучная метрика для админов, а единственный способ заставить ИИ приносить реальные деньги. Марш только начался, и победит в нем тот, кто умеет ловить ошибки раньше, чем их заметит клиент.

Если тема зашла — самое время держаться ближе к обновлениям (там часто всплывают детали, которые решают все).🔔 Чтобы читать больше про нейросети, AI-сервисы и практические кейсы, подписывайся на канал «ProAI» в Telegram!