Добавить в корзинуПозвонить
Найти в Дзене
Дом по уму

Что я хотел упростить: текст, голос и готовый PDF

Когда я начал думать о приложении для М-11, первым искушением было сделать больше. Добавить справочники. Потом остатки. Потом движения. Потом несколько типов документов. Потом интеграции. Так обычно и расползаются маленькие идеи: сначала нужна одна форма, а через пару дней ты уже мысленно строишь половину ERP. Но если честно смотреть на задачу, боль была не в этом. Боль была в моменте, когда человек уже знает, что нужно оформить, но должен вручную превратить это в документ. Поэтому я оставил простой маршрут: Это звучит почти слишком просто. Но именно простота здесь и важна. Я не хотел, чтобы пользователь открывал телефон и видел перед собой таблицу на 11 колонок. На компьютере это еще можно пережить. На телефоне такая форма быстро превращается в микроскопическую сетку, где человек больше борется с экраном, чем заполняет документ. Поэтому в приложении данные показываются не как Excel, а как понятные блоки: организация, отправитель, получатель, ответственные, материалы. А уже PDF собир

Когда я начал думать о приложении для М-11, первым искушением было сделать больше.

Добавить справочники. Потом остатки. Потом движения. Потом несколько типов документов. Потом интеграции. Так обычно и расползаются маленькие идеи: сначала нужна одна форма, а через пару дней ты уже мысленно строишь половину ERP.

Но если честно смотреть на задачу, боль была не в этом.

Боль была в моменте, когда человек уже знает, что нужно оформить, но должен вручную превратить это в документ.

Поэтому я оставил простой маршрут:

  1. Человек вводит текст или диктует голосом.
  2. Приложение получает черновик формы М-11.
  3. Человек проверяет поля.
  4. Приложение создает PDF.
  5. PDF можно отправить или распечатать.

Это звучит почти слишком просто. Но именно простота здесь и важна.

Я не хотел, чтобы пользователь открывал телефон и видел перед собой таблицу на 11 колонок. На компьютере это еще можно пережить. На телефоне такая форма быстро превращается в микроскопическую сетку, где человек больше борется с экраном, чем заполняет документ.

Поэтому в приложении данные показываются не как Excel, а как понятные блоки: организация, отправитель, получатель, ответственные, материалы. А уже PDF собирается похожим на официальный бланк М-11.

-2

Самый естественный ввод для такой задачи - обычная фраза.

Например:

Со склада материалов в цех упаковки отпустить 12 коробок саморезов, получил Сидоров, разрешил Мельников.

Или голосом, если человек находится не за столом.

Голосовой ввод здесь не делает приложение "умным" сам по себе. Он просто убирает лишний набор текста. Особенно если нужно быстро зафиксировать несколько позиций, а потом спокойно проверить черновик.

Дальше начинается часть, которую пользователь не обязан видеть во всех технических деталях. Текст уходит на backend, там проверяется доступ и лимиты, затем запрос идет к Yandex AI Studio, ответ возвращается как структурированный JSON для М-11. После этого приложение показывает экран проверки.

Почему не обращаться к AI прямо из Android?

Потому что ключи и лимиты не должны жить в приложении. AI API key хранится на серверной стороне. Там же должна быть проверка тарифа, бесплатного остатка и usage-счетчиков. Для пользователя это выглядит просто: ввел текст, получил черновик. Но внутри важно не превратить приложение в дырку для секретов и расходов.

Еще одна важная вещь - профиль организации.

В М-11 есть реквизиты, которые повторяются: организация, ОКПО, подразделения, ответственные, некоторые поля по умолчанию. Их нет смысла каждый раз вытаскивать из свободного текста. Пользователь один раз заполняет профиль, а приложение подставляет эти данные, когда AI их не нашел в фразе.

На практике это делает сценарий спокойнее. Не нужно каждый раз писать полное название организации. Не нужно надеяться, что модель угадает постоянные реквизиты. Постоянное должно храниться как настройка, а переменное можно брать из фразы.

В итоге я хотел упростить не "все документы", а три конкретных момента:

  • ввод, чтобы можно было писать или диктовать обычным языком;
  • проверку, чтобы человек видел черновик до PDF;
  • выпуск документа, чтобы на выходе был готовый PDF М-11.

Именно этот узкий маршрут делает продукт понятным.

Он не спорит с бухгалтерией. Не заменяет складскую систему. Не обещает закрыть всю учетную работу. Он помогает там, где человек уже знает факты выдачи материалов и хочет быстрее оформить их в форму.

В следующих статьях я покажу подробнее, как обычная фраза превращается в поля М-11 и почему я специально оставил экран проверки между AI и PDF.

Если вам интересно наблюдать за таким продуктом без рекламного шума, подписывайтесь на канал. Я буду дальше простыми словами разбирать, что в нем сделано и почему.