Команда Google Health AI представила MedASR – новую модель преобразования речи в текст, основанную на архитектуре Conformer. Она разработана для автоматической транскрипции медицинской диктовки и разговоров между врачами и пациентами, с возможностью интеграции в существующие рабочие процессы с использованием искусственного интеллекта. MedASR является отправной точкой для разработчиков, желающих создавать приложения в сфере здравоохранения, основанные на распознавании голоса. Примеры включают инструменты для диктовки в радиологии и системы для ведения записей о приеме пациентов. Модель содержит 105 миллионов параметров и работает с одноканальным аудио формата WAV (16 кГц, 16 бит). Вывод представлен в виде текста, что позволяет легко интегрировать MedASR с системами обработки естественного языка и генеративными моделями, такими как MedGemma. MedASR входит в состав Health AI Developer Foundations, наряду с другими медицинскими моделями, такими как MedGemma и MedSigLIP, и имеет единые усло
Google Health AI представила MedASR для медицинской транскрипции
28 декабря 202528 дек 2025
1 мин