Найти в Дзене

Голосовые AI-агенты: настройка звонков в Make.com — пошагово

Голосовые AI-агенты в связке с Make.com — это системы автоматизированной коммуникации, объединяющие генеративные речевые модели (Speech-to-Speech) с бизнес-логикой компании. Такая интеграция позволяет вести диалог с задержкой менее 800 мс, проверяя наличие товаров, записывая клиентов в CRM и обновлять данные в реальном времени без участия оператора. Еще пару лет назад разговор с роботом напоминал общение с навигатором, который внезапно потерял спутники. Паузы по три секунды, механические интонации и полное непонимание контекста. Сегодня, в 2026 году, ситуация изменилась радикально. Я вчера три минуты общался с менеджером стоматологии, пытаясь перенести запись, и только когда «девушка» уточнила, подтверждаю ли я передачу данных по протоколу API, я понял, с кем (или с чем) говорю. Секрет такой реалистичности не только в новых моделях OpenAI Realtime API, но и в том, что находится «под капотом». Мозги агента — это нейросеть, а его руки — это сценарии в Make.com (бывший Integromat). Именно
Оглавление
   Пошаговое руководство по интеграции голосовых помощников в рабочие процессы Make.com. Артур Хорошев
Пошаговое руководство по интеграции голосовых помощников в рабочие процессы Make.com. Артур Хорошев

Голосовые AI-агенты в связке с Make.com — это системы автоматизированной коммуникации, объединяющие генеративные речевые модели (Speech-to-Speech) с бизнес-логикой компании. Такая интеграция позволяет вести диалог с задержкой менее 800 мс, проверяя наличие товаров, записывая клиентов в CRM и обновлять данные в реальном времени без участия оператора.

Еще пару лет назад разговор с роботом напоминал общение с навигатором, который внезапно потерял спутники. Паузы по три секунды, механические интонации и полное непонимание контекста. Сегодня, в 2026 году, ситуация изменилась радикально. Я вчера три минуты общался с менеджером стоматологии, пытаясь перенести запись, и только когда «девушка» уточнила, подтверждаю ли я передачу данных по протоколу API, я понял, с кем (или с чем) говорю.

Секрет такой реалистичности не только в новых моделях OpenAI Realtime API, но и в том, что находится «под капотом». Мозги агента — это нейросеть, а его руки — это сценарии в Make.com (бывший Integromat). Именно Make позволяет агенту не просто болтать, а реально работать: лезть в Google Таблицу, проверять слоты в календаре или отправлять SMS. Если вы хотите собрать такого монстра продаж, забудьте про старые скрипты IVR. Сейчас мы соберем актуальную для 2026 года архитектуру.

Рынок 2026: Инструменты и скорость

Главная валюта голосовых ботов — это latency (задержка). Если бот думает дольше 1 секунды, магия рушится. Стандарт индустрии сейчас — 500–800 мс. Для этого используются специализированные платформы-прослойки, которые берут на себя транскрибацию и синтез речи, оставляя для Make.com только функцию исполнения команд.

Сравнительная таблица лидеров (Data SEO)

Выбор инструмента зависит от того, насколько глубоко вы готовы лезть в код и какая задержка допустима для вашей ниши.

Платформа Главная фишка (USP) Сценарий для Make.com Средняя задержка Vapi.ai Server URL (Function Calling) Идеален для входящих: проверка статуса заказа, запись к врачу. Гибкая передача JSON. ~600 мс Retell AI Реалистичность и перебивания Массовые холодные обзвоны (ai обзвон). Лучше всех понимает, когда клиент перебивает. ~500 мс Bland AI Проход секретарей и IVR Сложные B2B продажи. Умеет нажимать кнопки «1» или «0» в тональном режиме. ~700 мс Synthflow Полный No-code Быстрый запуск для малого бизнеса без навыков программирования. ~900 мс

Пошаговая настройка сценария «Умный администратор»

Разберем классику: клиент звонит, чтобы записаться на услугу. Бот должен проверить свободное время в вашей базе данных (Google Sheets, Airtable или CRM) через Make и подтвердить запись.

Шаг 1: Подготовка мозга (AI-платформа)

Возьмем для примера Vapi или Retell, так как они дают лучший контроль над API. В личном кабинете платформы нужно создать ассистента и прописать ему системный промпт. Но самое важное — настроить инструменты (Tools).

  • Создайте инструмент (Function), назовите его, например, check_availability.
  • В поле Server URL вставьте адрес вебхука, который мы сейчас создадим в Make.
  • Опишите параметры, которые бот должен извлечь из речи клиента: date (дата) и time (время).

Шаг 2: Логика проверки в Make.com

Этот сценарий должен быть максимально легким. Чем меньше модулей, тем быстрее ответ. Не нагружайте этот этап сложной аналитикой.

  1. Триггер: Custom Webhook. Принимает запрос от AI-агента. Входящие данные будут в формате JSON: { "date": "завтра", "time": "14:00" }.
  2. Поиск: Google Sheets (Search Rows). Подключаем таблицу-расписание. Фильтр прост: Искать строку, где Дата совпадает с запросом И Время совпадает с запросом И Статус ячейки — «Свободно».
  3. Развилка: Router.Путь А (Найдено): Используем модуль Webhook Response. В тело ответа (Body) пишем JSON: { "result": "available", "message": "Это время свободно. Записываю вас?" }.
    Путь Б (Занято): Другой Webhook Response. Ответ: { "result": "busy", "message": "На 14:00 уже занято. Могу предложить 15:30." }.
  📷
📷

https://kv-ai.ru/obuchenie-po-make

Шаг 3: Аналитика после звонка (Post-Call)

Когда трубка повешена, скорость уже не важна. Тут мы запускаем второй сценарий в Make для обработки данных.

  • Триггер: Webhook от платформы с событием «End of Call».
  • JSON Parse: Разбираем присланный массив данных. Там будет полная транскрипция, длительность и, что важно, мета-анализ (AI сам определит, был ли клиент доволен).
  • CRM (AmoCRM/Bitrix24/Pipedrive): Если сделка состоялась — создаем карточку. Если нет — ставим задачу менеджеру перезвонить.
  • Уведомления: Модуль Telegram отправляет сводку в рабочий чат, если лид помечен как «горячий».

Лайфхаки архитектора (2026 Edition)

Чтобы система работала гладко и не пугала людей «роботизированностью», нужно учитывать нюансы, о которых редко пишут в документации.

Маскировка задержки (Filler Words)

Даже 600 мс тишины могут напрягать. Настройте в AI-платформе фразы-заполнители. Пока Make шерстит таблицу, бот должен говорить: «Так, секунду, смотрю расписание…» или «Дайте-ка проверю систему…». Это выигрывает драгоценное время и делает диалог живым.

Гибридная память

Не заставляйте клиента повторять то, что вы и так знаете. При исходящем обзвоне (модуль Make a Call) передавайте контекст в переменные.

Пример JSON: { "customer_name": "Иван", "last_order": "Пицца Пепперони" }.

Тогда бот начнет разговор не с сухого «Здравствуйте», а с «Иван, привет! Как вам прошлая Пепперони? Хотите повторить?» Это поднимает конверсию на 30–40%.

Борьба с галлюцинациями

Нейросети любят придумывать. В системном промпте жестко пропишите правило: «Если Make вернул ошибку или пустой ответ, скажи: ‘Простите, база данных сейчас обновляется, я перезвоню через минуту’». Никогда не разрешайте боту выдумывать свободные слоты, если он не получил подтверждения от вебхука.

Зачем учиться автоматизации, если есть готовые решения?

Кажется, что достаточно скопировать схему выше, и бизнес полетит. На практике вы столкнетесь с тем, что Google Sheets не выдержит нагрузки в 1000 звонков, вебхуки начнут отваливаться по тайм-ауту, а логика разговора потребует нелинейных ветвлений. Голосовой агент или Asterisk — это лишь инструменты. Архитектура решения — это то, за что платят деньги.

Понимание принципов построения отказоустойчивых сценариев в Make.com отличает инженера от «копипастера». Рынок автоматизации в России растет геометрически, и специалисты, умеющие связывать голос, текст и базы данных в единую экосистему, становятся новым золотым фондом IT.

Обучение по Автоматизации, CursorAI, маркетингу и make.com
Блюпринты по make.com

Частые вопросы

Сколько стоит минута разговора AI-агента?

В среднем по рынку в 2026 году цена складывается из трех частей: телефония (SIP), транскрибация/синтез и работа LLM. Итоговая стоимость колеблется от 10 до 25 центов за минуту разговора. Это все равно в 5-7 раз дешевле, чем работа живого оператора колл-центра.

Нужно ли уметь программировать?

Для базовых сценариев в www make com программирование не нужно, достаточно логического мышления. Однако для сложных функций (например, криптографической подписи запросов или сложной обработки массивов данных) знание JavaScript и JSON будет огромным плюсом.

Как AI справляется с плохой связью или акцентом?

Современные модели Whisper (и их аналоги) распознают речь лучше человека. Они понимают шепот, сильный акцент и даже речь на фоне шума улицы. Проблема чаще возникает не в понимании, а в качестве SIP-телефонии.

Можно ли использовать это в России легально?

Да. Главное требование закона — предупредить собеседника о том, что ведется запись разговора, или что с ним говорит робот (в зависимости от трактовки юристов и сферы бизнеса). Серверы для хранения персональных данных должны находиться в РФ, поэтому связку часто строят так, чтобы Make не хранил данные, а сразу передавал их в локальную CRM.

Что делать, если Make зависнет во время звонка?

На этот случай в AI-агентах настраивается «Fallback». Если вебхук не отвечает в течение 3 секунд, бот переходит на резервную ветку диалога: записывает контакт и обещает, что менеджер свяжется лично. Это спасает репутацию.

Хотите научиться автоматизации рабочих процессов с помощью сервиса make.com и нейросетей? Подпишитесь на наш Telegram-канал.
Мы в MAX.
Не забывайте использовать правильные инструменты:
MCP сервис автоматизации «ВСЁ ПОДКЛЮЧЕНО» wordstat, wordpress, Вконтакте, телеграм, нейросети генерации картинок, фотосток и другое.