🔹 Xiaomi выпустила сразу три модели MiMo — LLM, мультимодальную модель и TTS — и не просто так: цель — агенты, которые видят, слышат и сами
взаимодействуют с ПО и окружением. • MiMo‑V2‑Pro — большая MoE‑модель (триллион параметров, ~42B активных) с длинным контекстом и ускоренной генерацией; по бенчмаркам близка к лидерам и заметно дешевле по API. • MiMo‑V2‑Omni — объединяет изображение, аудио и видео, умеет самостоятельно навигировать в браузере и анализировать дорожные съемки. • MiMo‑V2‑TTS — эмоции и паралингвистика из текста (даже пение) без плясок со сплайсингом...