Распознавание речи на Python с помощью PyAudio и SpeechRecognition
Распознавание речи в текст онлайн: 8 сервисов и сравнение точности
Распознавание речи в текст, это технология, которая превращает голос в готовый текст: вы диктуете в микрофон или загружаете аудиофайл, а нейросеть выдаёт расшифровку. Разобрали 8 сервисов и сравнили точность на русском: у Yandex SpeechKit ошибок около 4-5%, у Whisper от OpenAI примерно 6-8%, а на чистой записи топ-модели почти сравнялись. Показали, что выбрать для диктовки и для расшифровки файла, где это бесплатно и работает без VPN. Перевести голос в текст сегодня умеют десятки сервисов: от бесплатного блокнота в браузере до корпоративных API за деньги...
Управляйте бизнесом голосом: как «1С:Распознавание речи» меняет правила игры для сотрудников на ходу
Привет, это СБиСик. Сегодня тема вроде бы простая — голос, текст, 1С — а на деле там целый кусок удобства, экономии времени и, что уж греха таить, человеческого облегчения. Потому что руками всё печатать можно, конечно. Но когда у тебя склад, выезд, приемка, заявки, комментарии, статусы, и всё это надо вносить быстро, голова начинает смотреть на клавиатуру уже как на личного врага. Вот тут и выстреливает распознавание речи. Не как отдельная игрушка «поговорил в микрофон — получил текст где-то там»...