Добавить в корзинуПозвонить
Найти в Дзене
UbeDevs

OCR: Как превратить картинку в текст

Друзья,
сегодня хочу поговорить с вами об одной очень крутой штуке, которая
называется OCR. На самом деле, это всего лишь сокращение от английских
слов "Optical Character Recognition", что в переводе означает
"оптическое распознавание символов". Звучит мудрёно, но на деле это то, с
чем вы сталкиваетесь каждый день, даже не задумываясь об этом.
Например, когда сканируете документ, а потом можете выделить и
скопировать текст из него. Или когда фотографируете визитку, а ваш
телефон автоматически заносит все данные в контакты. Вот за всё это
отвечает OCR.
По сути, это технология, которая берёт любое
изображение, где есть буквы, и превращает эти буквы в настоящий,
редактируемый текст. Это как если бы вы взяли карандаш и обвели все
слова на картинке, а потом эти обведённые слова magically превратились в
текст, который можно править в Ворде. До того, как появились такие
программы, если тебе нужно было перенести текст из бумажного документа в
компьютер, приходилось сидеть и вр


OCR: Как превратить картинку в текст
OCR: Как превратить картинку в текст

Друзья,
сегодня хочу поговорить с вами об одной очень крутой штуке, которая
называется OCR. На самом деле, это всего лишь сокращение от английских
слов "Optical Character Recognition", что в переводе означает
"оптическое распознавание символов". Звучит мудрёно, но на деле это то, с
чем вы сталкиваетесь каждый день, даже не задумываясь об этом.
Например, когда сканируете документ, а потом можете выделить и
скопировать текст из него. Или когда фотографируете визитку, а ваш
телефон автоматически заносит все данные в контакты. Вот за всё это
отвечает OCR.

По сути, это технология, которая берёт любое
изображение, где есть буквы, и превращает эти буквы в настоящий,
редактируемый текст. Это как если бы вы взяли карандаш и обвели все
слова на картинке, а потом эти обведённые слова magically превратились в
текст, который можно править в Ворде. До того, как появились такие
программы, если тебе нужно было перенести текст из бумажного документа в
компьютер, приходилось сидеть и вручную перепечатывать каждую букву.
Представляете, сколько это занимало времени? Теперь же достаточно просто
сфотографировать или отсканировать страницу, и специальная программа
сделает всю работу за вас.

Как это работает? Сначала программа
анализирует изображение и находит на нём зоны, где, по её "мнению",
находятся буквы и цифры. Потом она выделяет каждую отдельную букву,
создавая из неё такую маленькую картинку. Затем начинается самое
интересное: программа сравнивает каждую такую "картинку-букву" с
огромной базой данных известных ей шрифтов и символов. Это похоже на то,
как маленький ребёнок учится читать, когда ему показывают картинки с
буквой "А" в разных её начертаниях. Программа делает то же самое, но
только в тысячи раз быстрее. Она пытается сопоставить увиденное с тем,
что она "знает". И если совпадение найдено, она "понимает", что это,
например, буква "А". Затем она собирает все распознанные буквы в слова, а
слова, в предложения, и в итоге получается готовый текст.

Конечно,
OCR не всегда идеален. Иногда он может ошибаться, особенно если текст
на изображении не очень чёткий, или шрифт какой-то заковыристый. Но
современные алгоритмы стали настолько умными, что могут справиться даже с
рукописным текстом (хотя и не всегда). Эту технологию используют в
самых разных областях. Например, в банках для распознавания реквизитов
на квитанциях, в системах видеонаблюдения для распознавания номеров
автомобилей, в приложениях-переводчиках, которые могут переводить текст
прямо с картинки. Это очень удобный и мощный инструмент, который
сэкономил и продолжает экономить миллионам людей кучу времени и усилий.
Вот так, друзья, от простой фотографии можно получить полноценный текст,
благодаря магии OCR.