Добавить в корзинуПозвонить
Найти в Дзене

Текст с фото чека или документа распознаётся с ошибками: перепроверяем и исправляем без нервов

Главное в проверке чеков и документов - не допустить ошибки в важных цифрах! Вы фотографируете чек или страницу договора, загружаете в нейросеть, получаете текст. Быстро пробегаете глазами и думаете: вроде нормально. Знакомое ощущение. Секунд на пять зависаешь с мыслью «а вдруг всё остальное тоже неверно», возвращаешься к фото, начинаешь сверять вручную и раздражаешься: зачем вообще использовал нейросеть, если всё равно перепроверяю сам. Здесь не вопрос плохого сервиса или вашей невнимательности. Распознавание с фото работает хорошо только при определённых условиях, и когда эти условия не совпадают, ошибки появляются регулярно. Но их можно предсказать и быстро поймать, если знать, где смотреть. Нейросеть иногда переставляет поля местами или «склеивает» соседние строки в одну, и тогда данные теряют смысл, хотя отдельные слова распознаны верно. Но именно так в документ попадают неверные суммы или чужие реквизиты, и потом уходит гораздо больше времени на исправление и объяснение. Нижня
Оглавление

Главное в проверке чеков и документов - не допустить ошибки в важных цифрах!

Вы фотографируете чек или страницу договора, загружаете в нейросеть, получаете текст. Быстро пробегаете глазами и думаете: вроде нормально.

  • Но потом, уже когда вносите данные в таблицу или отчёт, замечаете что-то странное. Сумма не та. Дата другая. Реквизиты съехали.

Знакомое ощущение. Секунд на пять зависаешь с мыслью «а вдруг всё остальное тоже неверно», возвращаешься к фото, начинаешь сверять вручную и раздражаешься: зачем вообще использовал нейросеть, если всё равно перепроверяю сам.

Здесь не вопрос плохого сервиса или вашей невнимательности. Распознавание с фото работает хорошо только при определённых условиях, и когда эти условия не совпадают, ошибки появляются регулярно.

Но их можно предсказать и быстро поймать, если знать, где смотреть.

Почему нейросеть путает символы

  1. Первая причина: фото сделано в спешке. Небольшое размытие, боковой угол, тень от руки или блик от лампы, и нейросеть видит не цифру, а что-то похожее на неё. Особенно часто путаются пары 0/О, 1/I, 8/В, 5/6.
  2. Вторая причина: сам документ сложный для распознавания. Термочеки выцветают, шрифт на них мелкий и бледный. На договорах бывают печати прямо поверх текста, подписи перекрывают строки с суммой. В таких случаях нейросеть угадывает, а не читает точно.
  3. Третья причина: структура документа нестандартная. Таблицы, колонки, сокращения, смешение русского и латинского текста в одной строке.

Нейросеть иногда переставляет поля местами или «склеивает» соседние строки в одну, и тогда данные теряют смысл, хотя отдельные слова распознаны верно.

Что чаще всего идёт не так

  • Копировать всё сразу. Распознанный текст выглядит связно, поэтому возникает соблазн сразу перенести его в нужное место.

Но именно так в документ попадают неверные суммы или чужие реквизиты, и потом уходит гораздо больше времени на исправление и объяснение.

-2
  • Проверять только начало. Первые строки чаще всего распознаются точно: там крупный шрифт, название, логотип.

Нижняя часть чека с итоговой суммой или раздел с датой и номером в середине договора остаются без внимания, и именно там чаще всего прячется ошибка.

  • Оставлять фото как есть. Если снимок захватил край стола, пальцы или смятый угол чека, нейросеть старается «прочитать» и это тоже.

В тексте появляются лишние символы, поля перемешиваются, и результат становится труднее проверять.

  • Исправлять по памяти или логике. Видите непонятный символ и думаете: «наверное, это семёрка». Иногда угадываете, иногда нет.

Риск невысокий, пока речь о слове, но в ИНН или номере счёта одна неверная цифра делает весь документ нерабочим.

  • Проверять всё подряд. Если вычитывать каждое слово, уходит много сил и времени, и через несколько минут внимание рассеивается.

В итоге самое важное поле всё равно может остаться непроверенным, просто потому что вы уже устали.

Как выстроить проверку, чтобы не нервничать

  • Сначала оцените фото до распознавания. Посмотрите на снимок: текст резкий, строки читаются, нет сильных теней и засветов. Если сомневаетесь, лучше переснять сразу, чем исправлять результат потом.
  • Когда переснимаете, держите камеру прямо над документом, без наклона. Уберите лишние предметы вокруг, найдите равномерный свет без прямых бликов.
  • Если документ длинный или шрифт мелкий, сделайте два кадра: верхнюю половину и нижнюю.
-3
  • Перед загрузкой обрежьте снимок так, чтобы в кадре остался только текст. Стол, края, пальцы, смятые углы убирайте. Ровный прямоугольник с документом распознаётся заметно чище.
  • Если снимок бледный или с тенями, немного поднимите контраст и яркость. Главное не переусердствовать: при слишком сильном осветлении тонкие линии букв и цифр размываются и нейросеть начинает ошибаться ещё больше.
  • После распознавания не читайте текст подряд. Проверяйте по приоритету: сначала сумма, потом дата, потом реквизиты или номер документа.

Именно в этих местах ошибка критична, и именно там нейросеть путается чаще всего из-за цифр и схожих символов.

  • Если видите спорный символ, открывайте фото и смотрите в оригинал. Не угадывайте. Двадцать секунд на сверку сейчас лучше, чем путаница в документах потом.
  • Проверяйте каждую группу цифр отдельно: номер договора, ИНН, сумму с копейками.
  • Когда ключевые поля проверены и поправлены, пробегите по ним ещё раз глазами за одну секунду и сохраните рядом оригинальное фото.
  • Если кто-то потом поставит данные под сомнение, вы сразу покажете источник и не будете искать чек по всем папкам.

Как это работает на практике

Знакомая ситуация: фрилансер, который ведёт учёт расходов, фотографирует чеки и загружает их в нейросеть, чтобы вносить суммы в таблицу. Удобно, пока не всплывает ошибка в итоговой сумме за квартал.

Разобравшись, он поменял подход. Теперь перед загрузкой оценивает снимок: если чек бледный или сфотографирован под углом, переснимает. Затем обрезает кадр, оставляя только текст, и чуть поднимает контраст в редакторе на телефоне.

После распознавания проверяет только три поля: сумму, дату и название продавца. Однажды нейросеть превратила «1 850» в «1 350», и именно сверка с фото сразу это поймала.

Теперь весь процесс занимает примерно на минуту дольше, чем раньше, зато данные в таблице точные и возвращаться к ним уже не нужно.

-4

Нейросеть ошибается при распознавании, и это не исключение, а норма для сложных фото. Но большинство ошибок предсказуемы: они появляются в определённых местах и из-за конкретных причин, которые легко устранить на входе.

Попробуйте простой порядок уже при следующем распознавании: сначала оцените фото, обрежьте лишнее, затем проверьте три ключевых поля по оригиналу. Скорее всего, вы заметите, что тревоги стало меньше, а результат стал надёжнее.

А вы перепроверяете фото с чеков или документов? Пишите в комментариях👇