8 месяцев назад
Обработка изображений с помощью технологий OCR: Tesseract и аналоги
ORS(Оптическое распознавание символов) — это технология, позволяющая преобразовывать различные типы документов, такие как отсканированные бумажные документы, PDF-файлы или изображения, в текст, который можно редактировать и искать. OCR использует алгоритмы обработки изображений и машинного обучения для идентификации символов и слов в визуальном контенте. Это делает OCR неотъемлемой частью современных бизнес-процессов и автоматизации. В современном мире OCR находит применение в самых разных сферах...
06:44
1,0×
00:00/06:44
336,6 тыс смотрели · 3 года назад
179 читали · 2 года назад
Распознавание текста с помощью pytesseract
Не так давно я озадачился вопросом распознавания печатного текста в своём приложении. Мне стало интересно, какие на данный момент существуют OCR-библиотеки и насколько они удобны в использовании. А главное - будет ли приемлемый результат распознавания текста и можно ли такой текст потом озвучить? Озвучка текста это тема для отдельной статьи, а сегодня мы напишем приложение на Python, которое сможет распознавать тексты на русском языке благодаря OCR-библиотеке Tesseract. Если вы столкнулись с задачей...