В НИТУ МИСИС разработали инновационный подход к оптимизации систем оптического распознавания текста (OCR). С помощью машинного обучения и современных генеративных моделей ИИ удалось повысить точность распознавания текста на русском языке и сократить время обучения с нескольких недель до 72 часов. В условиях, когда компании активно оцифровывают документы — от счетов до архивов, — технологии OCR особенно актуальны. Однако стандартные системы не всегда справляются с реальными сканами, содержащими печати, подписи или нестандартные шрифты. Для повышения качества требуется обучение, которое традиционно занимает значительное время — до двух месяцев. Учёные НИТУ МИСИС предложили метод на основе комбинации машинного обучения и генеративных моделей ИИ. Они внедрили замкнутый цикл взаимодействия между OCR-движками и языковыми моделями: система самостоятельно анализирует результаты распознавания и корректирует ошибки. Это сократило процесс обучения до 72 часов непрерывной работы. Одним из ключевых
Новый способ ускоренной оптимизации систем оптического распознавания текста разработали в НИТУ МИСИС
13 декабря13 дек
5
1 мин