Возможность нормально разговаривать с хорошей моделью требует неких танцев с бубном (обычно в форме Eleven Labs); когда в прошлом году мы затеяли на YAC/e живой разговор людей и Клауса (который помогает студентов учить и ведет с ними семинары) — намучились, чтобы все было живо и быстро, безо всяких пауз. В посте по ссылке авторы мягко называют эту конструкцию external scaffolding. И вот именно его решили избежать, подход хорош: We think interactivity should scale alongside intelligence; the way we work with AI should not be treated as an afterthought. И утверждают, что цели своей добились, модель с нуля спроектирована и обучена так, чтобы не просто быть автономной, а действительно чутко реагирующей на любое вмешательство человека в процессе в процессе совместной работы. Вмешательство может быть мультимодально: модель мгновенно реагирует голосом (если ее попросить) на, например, появление чпеловека в кадре, ,если у модели есть доступ к камере. От демки по ссылке слюнки текут, быстрей
Команда Миры Мурати из Thinking Machines очень порадовала
2 дня назад2 дня назад
1
~1 мин