Главное в проверке чеков и документов - не допустить ошибки в важных цифрах!
Вы фотографируете чек или страницу договора, загружаете в нейросеть, получаете текст. Быстро пробегаете глазами и думаете: вроде нормально.
- Но потом, уже когда вносите данные в таблицу или отчёт, замечаете что-то странное. Сумма не та. Дата другая. Реквизиты съехали.
Знакомое ощущение. Секунд на пять зависаешь с мыслью «а вдруг всё остальное тоже неверно», возвращаешься к фото, начинаешь сверять вручную и раздражаешься: зачем вообще использовал нейросеть, если всё равно перепроверяю сам.
Здесь не вопрос плохого сервиса или вашей невнимательности. Распознавание с фото работает хорошо только при определённых условиях, и когда эти условия не совпадают, ошибки появляются регулярно.
Но их можно предсказать и быстро поймать, если знать, где смотреть.
Почему нейросеть путает символы
- Первая причина: фото сделано в спешке. Небольшое размытие, боковой угол, тень от руки или блик от лампы, и нейросеть видит не цифру, а что-то похожее на неё. Особенно часто путаются пары 0/О, 1/I, 8/В, 5/6.
- Вторая причина: сам документ сложный для распознавания. Термочеки выцветают, шрифт на них мелкий и бледный. На договорах бывают печати прямо поверх текста, подписи перекрывают строки с суммой. В таких случаях нейросеть угадывает, а не читает точно.
- Третья причина: структура документа нестандартная. Таблицы, колонки, сокращения, смешение русского и латинского текста в одной строке.
Нейросеть иногда переставляет поля местами или «склеивает» соседние строки в одну, и тогда данные теряют смысл, хотя отдельные слова распознаны верно.
Что чаще всего идёт не так
- Копировать всё сразу. Распознанный текст выглядит связно, поэтому возникает соблазн сразу перенести его в нужное место.
Но именно так в документ попадают неверные суммы или чужие реквизиты, и потом уходит гораздо больше времени на исправление и объяснение.
- Проверять только начало. Первые строки чаще всего распознаются точно: там крупный шрифт, название, логотип.
Нижняя часть чека с итоговой суммой или раздел с датой и номером в середине договора остаются без внимания, и именно там чаще всего прячется ошибка.
- Оставлять фото как есть. Если снимок захватил край стола, пальцы или смятый угол чека, нейросеть старается «прочитать» и это тоже.
В тексте появляются лишние символы, поля перемешиваются, и результат становится труднее проверять.
- Исправлять по памяти или логике. Видите непонятный символ и думаете: «наверное, это семёрка». Иногда угадываете, иногда нет.
Риск невысокий, пока речь о слове, но в ИНН или номере счёта одна неверная цифра делает весь документ нерабочим.
- Проверять всё подряд. Если вычитывать каждое слово, уходит много сил и времени, и через несколько минут внимание рассеивается.
В итоге самое важное поле всё равно может остаться непроверенным, просто потому что вы уже устали.
Как выстроить проверку, чтобы не нервничать
- Сначала оцените фото до распознавания. Посмотрите на снимок: текст резкий, строки читаются, нет сильных теней и засветов. Если сомневаетесь, лучше переснять сразу, чем исправлять результат потом.
- Когда переснимаете, держите камеру прямо над документом, без наклона. Уберите лишние предметы вокруг, найдите равномерный свет без прямых бликов.
- Если документ длинный или шрифт мелкий, сделайте два кадра: верхнюю половину и нижнюю.
- Перед загрузкой обрежьте снимок так, чтобы в кадре остался только текст. Стол, края, пальцы, смятые углы убирайте. Ровный прямоугольник с документом распознаётся заметно чище.
- Если снимок бледный или с тенями, немного поднимите контраст и яркость. Главное не переусердствовать: при слишком сильном осветлении тонкие линии букв и цифр размываются и нейросеть начинает ошибаться ещё больше.
- После распознавания не читайте текст подряд. Проверяйте по приоритету: сначала сумма, потом дата, потом реквизиты или номер документа.
Именно в этих местах ошибка критична, и именно там нейросеть путается чаще всего из-за цифр и схожих символов.
- Если видите спорный символ, открывайте фото и смотрите в оригинал. Не угадывайте. Двадцать секунд на сверку сейчас лучше, чем путаница в документах потом.
- Проверяйте каждую группу цифр отдельно: номер договора, ИНН, сумму с копейками.
- Когда ключевые поля проверены и поправлены, пробегите по ним ещё раз глазами за одну секунду и сохраните рядом оригинальное фото.
- Если кто-то потом поставит данные под сомнение, вы сразу покажете источник и не будете искать чек по всем папкам.
Как это работает на практике
Знакомая ситуация: фрилансер, который ведёт учёт расходов, фотографирует чеки и загружает их в нейросеть, чтобы вносить суммы в таблицу. Удобно, пока не всплывает ошибка в итоговой сумме за квартал.
Разобравшись, он поменял подход. Теперь перед загрузкой оценивает снимок: если чек бледный или сфотографирован под углом, переснимает. Затем обрезает кадр, оставляя только текст, и чуть поднимает контраст в редакторе на телефоне.
После распознавания проверяет только три поля: сумму, дату и название продавца. Однажды нейросеть превратила «1 850» в «1 350», и именно сверка с фото сразу это поймала.
Теперь весь процесс занимает примерно на минуту дольше, чем раньше, зато данные в таблице точные и возвращаться к ним уже не нужно.
Нейросеть ошибается при распознавании, и это не исключение, а норма для сложных фото. Но большинство ошибок предсказуемы: они появляются в определённых местах и из-за конкретных причин, которые легко устранить на входе.
Попробуйте простой порядок уже при следующем распознавании: сначала оцените фото, обрежьте лишнее, затем проверьте три ключевых поля по оригиналу. Скорее всего, вы заметите, что тревоги стало меньше, а результат стал надёжнее.