Текст с фото чека или документа распознаётся с ошибками: перепроверяем и исправляем без нервов

1 июня1 июн

4 мин

Главное в проверке чеков и документов - не допустить ошибки в важных цифрах! Вы фотографируете чек или страницу договора, загружаете в нейросеть, получаете текст. Быстро пробегаете глазами и думаете: вроде нормально. Знакомое ощущение. Секунд на пять зависаешь с мыслью «а вдруг всё остальное тоже неверно», возвращаешься к фото, начинаешь сверять вручную и раздражаешься: зачем вообще использовал нейросеть, если всё равно перепроверяю сам. Здесь не вопрос плохого сервиса или вашей невнимательности. Распознавание с фото работает хорошо только при определённых условиях, и когда эти условия не совпадают, ошибки появляются регулярно. Но их можно предсказать и быстро поймать, если знать, где смотреть. Нейросеть иногда переставляет поля местами или «склеивает» соседние строки в одну, и тогда данные теряют смысл, хотя отдельные слова распознаны верно. Но именно так в документ попадают неверные суммы или чужие реквизиты, и потом уходит гораздо больше времени на исправление и объяснение. Нижня

Оглавление

Почему нейросеть путает символы
Что чаще всего идёт не так
Как выстроить проверку, чтобы не нервничать

Главное в проверке чеков и документов - не допустить ошибки в важных цифрах!

Вы фотографируете чек или страницу договора, загружаете в нейросеть, получаете текст. Быстро пробегаете глазами и думаете: вроде нормально.

Но потом, уже когда вносите данные в таблицу или отчёт, замечаете что-то странное. Сумма не та. Дата другая. Реквизиты съехали.

Знакомое ощущение. Секунд на пять зависаешь с мыслью «а вдруг всё остальное тоже неверно», возвращаешься к фото, начинаешь сверять вручную и раздражаешься: зачем вообще использовал нейросеть, если всё равно перепроверяю сам.

Здесь не вопрос плохого сервиса или вашей невнимательности. Распознавание с фото работает хорошо только при определённых условиях, и когда эти условия не совпадают, ошибки появляются регулярно.

Но их можно предсказать и быстро поймать, если знать, где смотреть.

Почему нейросеть путает символы

Первая причина: фото сделано в спешке. Небольшое размытие, боковой угол, тень от руки или блик от лампы, и нейросеть видит не цифру, а что-то похожее на неё. Особенно часто путаются пары 0/О, 1/I, 8/В, 5/6.
Вторая причина: сам документ сложный для распознавания. Термочеки выцветают, шрифт на них мелкий и бледный. На договорах бывают печати прямо поверх текста, подписи перекрывают строки с суммой. В таких случаях нейросеть угадывает, а не читает точно.
Третья причина: структура документа нестандартная. Таблицы, колонки, сокращения, смешение русского и латинского текста в одной строке.

Нейросеть иногда переставляет поля местами или «склеивает» соседние строки в одну, и тогда данные теряют смысл, хотя отдельные слова распознаны верно.

Что чаще всего идёт не так

Копировать всё сразу. Распознанный текст выглядит связно, поэтому возникает соблазн сразу перенести его в нужное место.

Но именно так в документ попадают неверные суммы или чужие реквизиты, и потом уходит гораздо больше времени на исправление и объяснение.

Проверять только начало. Первые строки чаще всего распознаются точно: там крупный шрифт, название, логотип.

Нижняя часть чека с итоговой суммой или раздел с датой и номером в середине договора остаются без внимания, и именно там чаще всего прячется ошибка.

Оставлять фото как есть. Если снимок захватил край стола, пальцы или смятый угол чека, нейросеть старается «прочитать» и это тоже.

В тексте появляются лишние символы, поля перемешиваются, и результат становится труднее проверять.

Исправлять по памяти или логике. Видите непонятный символ и думаете: «наверное, это семёрка». Иногда угадываете, иногда нет.

Риск невысокий, пока речь о слове, но в ИНН или номере счёта одна неверная цифра делает весь документ нерабочим.

Проверять всё подряд. Если вычитывать каждое слово, уходит много сил и времени, и через несколько минут внимание рассеивается.

В итоге самое важное поле всё равно может остаться непроверенным, просто потому что вы уже устали.

Как выстроить проверку, чтобы не нервничать

Сначала оцените фото до распознавания. Посмотрите на снимок: текст резкий, строки читаются, нет сильных теней и засветов. Если сомневаетесь, лучше переснять сразу, чем исправлять результат потом.
Когда переснимаете, держите камеру прямо над документом, без наклона. Уберите лишние предметы вокруг, найдите равномерный свет без прямых бликов.
Если документ длинный или шрифт мелкий, сделайте два кадра: верхнюю половину и нижнюю.

Перед загрузкой обрежьте снимок так, чтобы в кадре остался только текст. Стол, края, пальцы, смятые углы убирайте. Ровный прямоугольник с документом распознаётся заметно чище.
Если снимок бледный или с тенями, немного поднимите контраст и яркость. Главное не переусердствовать: при слишком сильном осветлении тонкие линии букв и цифр размываются и нейросеть начинает ошибаться ещё больше.
После распознавания не читайте текст подряд. Проверяйте по приоритету: сначала сумма, потом дата, потом реквизиты или номер документа.

Именно в этих местах ошибка критична, и именно там нейросеть путается чаще всего из-за цифр и схожих символов.

Если видите спорный символ, открывайте фото и смотрите в оригинал. Не угадывайте. Двадцать секунд на сверку сейчас лучше, чем путаница в документах потом.
Проверяйте каждую группу цифр отдельно: номер договора, ИНН, сумму с копейками.
Когда ключевые поля проверены и поправлены, пробегите по ним ещё раз глазами за одну секунду и сохраните рядом оригинальное фото.
Если кто-то потом поставит данные под сомнение, вы сразу покажете источник и не будете искать чек по всем папкам.

Как это работает на практике

Знакомая ситуация: фрилансер, который ведёт учёт расходов, фотографирует чеки и загружает их в нейросеть, чтобы вносить суммы в таблицу. Удобно, пока не всплывает ошибка в итоговой сумме за квартал.

Разобравшись, он поменял подход. Теперь перед загрузкой оценивает снимок: если чек бледный или сфотографирован под углом, переснимает. Затем обрезает кадр, оставляя только текст, и чуть поднимает контраст в редакторе на телефоне.

После распознавания проверяет только три поля: сумму, дату и название продавца. Однажды нейросеть превратила «1 850» в «1 350», и именно сверка с фото сразу это поймала.

Теперь весь процесс занимает примерно на минуту дольше, чем раньше, зато данные в таблице точные и возвращаться к ним уже не нужно.

Нейросеть ошибается при распознавании, и это не исключение, а норма для сложных фото. Но большинство ошибок предсказуемы: они появляются в определённых местах и из-за конкретных причин, которые легко устранить на входе.

Попробуйте простой порядок уже при следующем распознавании: сначала оцените фото, обрежьте лишнее, затем проверьте три ключевых поля по оригиналу. Скорее всего, вы заметите, что тревоги стало меньше, а результат стал надёжнее.

Текст с фото чека или документа распознаётся с ошибками: перепроверяем и исправляем без нервов

Почему нейросеть путает символы

Что чаще всего идёт не так

Как выстроить проверку, чтобы не нервничать

Как это работает на практике

А вы перепроверяете фото с чеков или документов? Пишите в комментариях👇