📄✨ Если вы давно ищете мощный инструмент для OCR, обратите внимание на Chandra OCR 2 от Datalab. Этот проект умеет преобразовывать картинки и PDF в структурированный Markdown, HTML или JSON, сохраняя всю важную информацию о разметке и даже распознавая сложные таблицы, математические формулы и рукописный текст. Плюс поддержка более 90 языков! Особенно классно, что есть два режима работы: локальный через HuggingFace и быстрый удалённый с vLLM-сервером. А ещё готовое API и удобное CLI делают жизнь проще. Для тех, кто любит всё «под капотом», есть open-source код с гибкой настройкой. Отличный выбор для всех, кто работает с разнообразными документами и хочет надежный, многоязычный OCR с крутыми фишками. #OCR #AI #GitHub #МашинноеОбучение #Python #Документы #Распознавание #OpenSource https://github.com/datalab-to/chandra https://vlad1kudelko.github.io/