С мощными инструментами для генерации видео, доступными сейчас большему количеству пользователей, давайте рассмотрим, как они работают. Предположим, что вы обычный пользователь. В настоящее время существует множество высококачественных инструментов, которые позволяют профессиональным видеомейкерам внедрять модели генерации видео в их рабочие процессы. Но большинство людей будет использовать эту технологию в приложении или через веб-сайт. Вы знаете, как это работает: "Эй, Gemini, сделай мне видео единорога, который ест спагетти. Теперь сделай так, чтобы его рог улетел как ракета". То, что вы получите взамен, будет удачным или неудачным, и вам обычно придется попросить модель сделать еще несколько попыток, прежде чем вы получите более-менее то, что хотели. Итак, что происходит под капотом? Почему результат может быть разным и почему это требует так много энергии? Последняя волна моделей генерации видео известна как латентные диффузионные трансформеры. Да, это довольно сложно. Давайте ра