Российский ИИ научили понимать схемы и скриншоты

Компания MWS AI (входит в МТС Web Services) представила на форуме «Финополис-2025» мультимодальную модель Cotype VL, которая умеет работать сразу с текстом и изображениями.Inc. Russia
Новый ориентир Кроме ИИ-модели, в MWS AI также разработали собственный открытый бенчмарк для мультимодальных моделей, способных одновременно анализировать изображения и текст — MWS Vision Bench.Forbes
Для обучения модели команда MWS AI собрала 150 тыс. документов и изображений из разных отраслей — от финансов до здравоохранения.Inc. Russia
Открытый исходный код бенчмарка выложен на GitHub, а датасет доступен на платформе Hugging Face.Forbes
Эта новость в СМИ
Больше — у авторов Дзена