Thinking Machines Lab, стартап Миры Мурати, представил новый класс голосовых моделей под названием interaction models. Смысл простой и амбициозный: ИИ должен не ждать конца вашей реплики, а слушать и формировать ответ одновременно. Первая версия, TML-Interaction-Small, по словам компании, укладывается в 0,40 секунды отклика. Ещё по теме: Для голосового ИИ это самая больная точка. OpenAI с Advanced Voice и Google с Gemini Live давно продают идею «живого разговора», но у большинства систем под капотом по-прежнему конвейер из распознавания речи, текстовой модели и синтеза голоса. Из-за этого ассистенты либо тормозят, либо перебивают не к месту. Thinking Machines пытается вшить интерактивность в саму модель, а не прикручивать ее поверх. ⚡Подписывайтесь на канал itzine и канал подкаста ForGeeks в Telegram! Там самые свежие новости про технологии, гаджеты, косплей и космос. На бумаге цифра хорошая, но без мистики. В исследованиях по разговорной речи средний зазор между репликами людей часто