Компания ByteDance разработала новую систему искусственного интеллекта под названием OmniHuman-1. Она умеет превращать обычные фотографии в реалистичные видеоролики, где люди двигаются, жестикулируют и даже говорят. Это серьезный шаг вперед по сравнению с предыдущими технологиями, которые могли анимировать только лица или верхнюю часть тела. Пока эта нейронка недоступна для публичного использования. Система создает видео в полный рост, где люди выглядят максимально естественно. Она учитывает речь, движения тела и даже мимику. Например, если на фото человек улыбается, на видео он будет улыбаться и жестикулировать в соответствии с текстом или аудио. Раньше подобные технологии ограничивались анимацией отдельных частей тела, но OmniHuman-1 справляется с задачей целиком. Это делает ее более универсальной и полезной для реальных приложений. Чтобы научить OmniHuman-1, разработчики использовали более 18 700 часов видеозаписей с людьми. Система анализировала текст, аудио и движения тела, что по
ByteDance создала ИИ, который превращает фото в видео: как это работает?
7 февраля 20257 фев 2025
1
2 мин