ИИ-центр группы Т-Технологии, которая владеет 99,97% акций Т-Банка, опубликовал в открытом доступе модель автоматического распознавания речи – T-one. В компании утверждают, что модель распознает речь в потоке, а также обгоняет по качеству похожие open source разработки Сбера и Open AI. T-one опубликовали на платформах Hugging Face и GitHub. Модель сравнительно небольшого размера – 70 млн параметров. Например, ASR-модель компании SberDevices GigaAM состоит из 240 млн параметров, в ASR-модели Whisper large-v3 от OpenAI – 1,55 млрд параметров. Однако по оценке Т-Технологий, Т-one обгоняет эти ASR-модели по качеству распознавания русского языка в телефонии. Представитель компании предполагает, что такие модели могут быть интересны как бизнесу, так и научному сообществу. Размер T-one позволяет запускать ее с ноутбука, и даже с учетом обслуживания, аренды или использования на своих серверах модель в десятки раз дешевле готовых решений от облачных провайдеров. Представитель Т-Технологий счита
Т-Технологии разместили в открытом доступе ИИ-модель автоматического распознавания речи
23 июля 202523 июл 2025
171
1 мин