Найти в Дзене
Agents N8N

Смотрите, сделал одному из клиентов интересную штуку

Задача простая — чтобы его клиенты могли закидывать PDF-файлы, а агент полностью читал их и работал с текстом. И тут есть два варианта, как это вообще можно реализовать. Вариант 1 — платные сервисы Можно не париться. Подключить Google Document AI, Amazon Textract и прочие сервисы. Они всё делают красиво, стабильно, масштабируемо. Но. Если смотреть по рынку, то: • минимум — от 0.0015$ за страницу • типичный диапазон — 0.01–0.07$ за страницу • SaaS-пакеты — по факту выходит 0.05–0.30$ за страницу И если считать в месяц, то спокойно набегает 10–50$ и выше, просто за то, чтобы читать PDF. ________________________________________ Вариант 2 — сделать у себя Мы пошли другим путём. У клиента стоит свой сервер с N8N, там же крутится агент. Можно установить туда Tesseract (OCR), прикреплять PDF напрямую и обрабатывать всё локально. По сути — бесплатно за страницу. Потому что всё уже на одном сервере. ________________________________________ И тут был интересный момент. Мы столкнулись с тем, что

Смотрите, сделал одному из клиентов интересную штуку.

Задача простая —

чтобы его клиенты могли закидывать PDF-файлы,

а агент полностью читал их и работал с текстом.

И тут есть два варианта, как это вообще можно реализовать.

Вариант 1 — платные сервисы

Можно не париться.

Подключить Google Document AI, Amazon Textract и прочие сервисы.

Они всё делают красиво, стабильно, масштабируемо.

Но.

Если смотреть по рынку, то:

• минимум — от 0.0015$ за страницу

• типичный диапазон — 0.01–0.07$ за страницу

• SaaS-пакеты — по факту выходит 0.05–0.30$ за страницу

И если считать в месяц, то спокойно набегает

10–50$ и выше, просто за то, чтобы читать PDF.

________________________________________

Вариант 2 — сделать у себя

Мы пошли другим путём.

У клиента стоит свой сервер с N8N,

там же крутится агент.

Можно установить туда Tesseract (OCR),

прикреплять PDF напрямую

и обрабатывать всё локально.

По сути — бесплатно за страницу.

Потому что всё уже на одном сервере.

________________________________________

И тут был интересный момент.

Мы столкнулись с тем, что из PDF читался только один лист.

А документ мог быть на 10–20–30 страниц.

Сегодня это исправил.

Теперь можно закидывать хоть сколько страниц —

весь текст полностью забирается

и передаётся агенту.

Вот это уже совсем другой уровень.

________________________________________

Да, сама доработка была платной.

Но она того стоит.

Потому что если у клиента идёт поток PDF-документов,

то экономия в долгосроке — очевидная.

Вопрос.

Как вы считаете, стоит ли внедрять такие вещи,

которые уменьшают постоянные расходы?

Даже если это «всего лишь» чтение PDF.

Кстати сравнение:

сервер n8n+сервер по чтению PDF = 800р+1000 р (+-)

сервер n8n+Tesseract= 800р

ну а дальше вы сами посчитаете выгоду в год?)