202 читали · 1 месяц назад
Как распознать PDF с таблицами и рукописью? Обзор Chandra OCR — бесплатной нейросети, работающей без интернета.
Кажется, только вчера все радовались, что можно просто сфоткать документ и получить текст. А сегодня? Сегодня этого уже мало. Сегодня хочется, чтобы программа не просто буквы угадывала, а понимала, где таблица, где заголовок, а где — каракули врача в рецепте. И чтобы всё это — без отправки своих сканов какому-то дяде на серверы в другую страну. Знакомая боль? Ну вот, кажется, на горизонте появилось что-то интересное, что может эту боль если не вылечить, то хотя бы облегчить. Речь про один свежий проект с GitHub, который уже наделал немного шума в узких кругах...