Ничто не ново под луной, но именно такой совет я почему-то никогда не встречала. Конечно, самый правильный способ - распознавать старые рукописный тексты нейросетью. Но правильный - не означает лучший. Если Яндекс не собирается публиковать свою, а пытливый исследователь - её писать с нуля, то всё, что остаётся - перепечатывать данные руками, используя то, что уже есть - свою голову. То, что помогало мне ускорить этот процесс - надиктовывание в сервис распознавания аудиосообщений. Чтение вслух самому себе. На мой взгляд, аудиосообщения в мессенджерах - абсолютное зло. Но это зло заставило ряд крупных сервисов, вроде Телеграм и ВК, прикрутить распознавание аудио в текст. В отличие от маленьких инициатив, эти ребята могут себе позволить делать его качественно. Я успела попробовать разное, пока эта функция не появилась у Телеграма. И распознает она очень хорошо. Следующий шаг - это читать текст не просто так, а с учётом формата, в который он будет преобразован. Конечная цель - получить
Нехитрый приём, как ускорить индексацию архивных документов
6 мая 20246 мая 2024
15
1 мин