Часть №4. Правильный диагноз ещё не решает проблему. Когда стало понятно, что проблема не в коде приложения как таковом, а в том, что часть IP-адресов из пула Битрикс24 фактически «битая» для нашего маршрута, ждать уже было нельзя. Клиентам не становится легче от того, что ты правильно поставил диагноз. Им нужно, чтобы сервис работал. Что пришлось строить под утро. Поэтому вместо спокойного разбора мы начали собирать аварийное решение. Логика была простой по смыслу, но сложной в реализации: 1. Научить систему определять проблемные адреса. 2. Не упираться в них. 3. Идти дальше через рабочие. Фактически нам пришлось на ходу делать свою механику проверки и перебора доступных точек входа. То, чего раньше в таком виде у нас не было, потому что раньше сама постановка задачи казалась избыточной. До ночи это была история про поиск причины. Под утро это уже была история про отказоустойчивость. После первого контура стало ясно: это только начало. После того как первый рабочий контур получи