Команда специалистов компании NVIDIA совместно с исследователями из Стэнфордского университета представила нейросетевую модель Test-Time Training (TTT). Разработанная модель способна генерировать анимационные видео продолжительностью около минуты, в которых присутствует сюжетная линия, действия персонажей и визуальное развитие событий. Для демонстрации потенциала этой технологии был выбран мультфильм «Том и Джерри». Исследователи обучили ИИ на материалах оригинальных серий, и теперь он может самостоятельно воспроизводить короткие эпизоды в том же стиле. Новая серия формируется по текстовому описанию, где подробно описывается, что должно произойти на экране. Как отметил один из авторов проекта, при просмотре сгенерированных видео заметны визуальные огрехи. Объекты и герои в некоторых кадрах могут временно менять форму, что связано с ограниченностью вычислительных мощностей. Представитель команды разработчиков, подчеркнул, что текущая версия модели использует только 5 млрд параметров. По
NVIDIA показала ИИ-модель, по описанию создающую минутные мультфильмы в духе «Тома и Джерри»
11 апреля11 апр
9
1 мин