Команда Google Health AI выпустила MedASR — модель преобразования речи в текст на основе архитектуры Conformer. Она предназначена для клинической диктовки и разговоров между врачами и пациентами и разработана для интеграции в современные рабочие процессы с использованием искусственного интеллекта. Что такое MedASR и как она используется? MedASR — это модель преобразования речи в текст, основанная на архитектуре Conformer. Она предварительно обучена для медицинской диктовки и транскрипции. Модель позиционируется как отправная точка для разработчиков, которые хотят создавать приложения для здравоохранения, основанные на распознавании голоса, такие как инструменты для диктовки в радиологии или системы для записи заметок о визитах пациентов. Модель имеет 105 миллионов параметров и принимает одноканальное аудио с частотой 16 000 герц и 16-битными целыми волновыми формами. Она выдаёт только текстовый вывод, поэтому может быть напрямую интегрирована в системы обработки естественного языка
Google Health AI выпускает MedASR: модель преобразования речи в текст на основе Conformer для клинической диктовки
СегодняСегодня
2 мин