506 читали · 1 год назад
РАСПОЗНАВАНИЕ текста в PDF-файлах с помощью Python
Привет, ребята! Возможно, вы слышали о распознавании текста с использованием Python. Самой известной библиотекой является tesseract, спонсируемая Google. Выполнить распознавание изображения очень просто. Проблема возникает, когда вы хотите выполнить распознавание текста поверх PDF-документа. Я работаю над проектом, в котором хочу вводить PDF-файлы, извлекать из них текст, а затем добавлять текст в базу данных. Мне пришлось много искать, прежде чем я наткнулся на окончательное решение. Итак, не теряя времени, давайте начнем...
286 читали · 3 года назад
Автоматизируем поиск в Google с помощью Python
Друзья всем привет, вы на канале PYTHONTODAY, добро пожаловать в рубрику "Полезные библиотеки Python" , в которой мы обсуждаем интересные, полезные и весьма простые программы на языке Python. Сегодня мы рассмотрим работу модуля GoogleSearch, инструмент для создания идеального скрипта автоматизации поиска в Google. Установка: $ pip установить googlesearch-python Примеры использования Импортируем модуль: from googlesearch import search Выполняем простой поиск, по дефолту язык английский: search("Kali...