Создание приложения для распознавания текста с изображений и аудиофайлов Запись текста с фотографии листа или из аудиозаписи в текстовый файл, доступный для редактирования – довольно часто встречающаяся задача при работе в офисах или учёбы. Для распознавания текстов и аудио в платных сервисах и программах сегодня используются такие подходы, как машинное зрение и распознавание речи с использованием глубоких нейронных сетей.Детектирование (обнаружение) и классификация символов на изображении осуществляется с использованием различных архитектур свёрточных нейронных сетей [1]. Обработка естественного языка основана на использовании глубоких рекуррентных нейронных сетей, состоящих из ячеек долгой краткосрочной памяти LSTM [2]. При создании соответствующих приложений для работы с текстами, этап реализации нейронных сетей можно пропустить, используя соответствующие свободно распространяемые библиотеки. В данной статье я хочу поделиться реализацией приложения, позволяющего пользователю преобразовать и сохранить текстовую информацию из изображения листа или аудио-файла. Читать далее https://habr.com/ru/articles/758882/?utm_source=habrahabr&utm_medium=rss&utm_campaign=758882
Автор Мед Харбах В этом посте я поделюсь с вами коллекцией некоторых из лучших приложений для транскрипции аудио, которые вы и ваши ученики можете использовать для простого преобразования аудиозаписей в текст. Эти приложения для преобразования аудиозаписи в текст предлагают широкий спектр функций, которые особенно подходят нам в сфере образования. Студенты могут использовать их для записи лекций и голосовых заметок, которые автоматически расшифровываются в течение нескольких минут. Некоторые из этих приложений даже предлагают транскрипцию в реальном времени...