550 подписчиков
Может, вы помните сделанное мной недавно мимоходом обещание рассказать о нейросети Pika. Если не помните — не страшно, я напомню: вот оно тут, в самом конце поста. Так вот, начинаю выполнять.
Открытия доступа к сервису пришлось подождать всего недельку, и под конец прошлого года мне его торжественно выдали. Pika занимается исключительно генерацией видео — как по текстовой подсказке, так и по загруженным видео и изображениям. Есть довольно неплохой комплект настроек, а готовые ролики можно удлинять и увеличивать их разрешение. Но прежде чем я перейду к подробному рассказу обо всех возможностях Pika, следует показать товар лицом. А чтобы сделать показ интереснее, добавим соревновательный момент.
В этом небольшом видеоролике собраны попарно генерации "Кандинского" и Pika, сделанные по одним и тем же описаниям. Посмотрите, сравните, сделайте выводы. На первый взгляд очевидно главное: там, где "Кандинский" рисует множество покадровых несовпадений, которые выливаются в дрожащую и плывущую картинку, Pika копирует кадры чётко, добавляя анимацию (довольно убедительную) только там, где требуется.
Но есть второе существенное различие, которого вы не заметите, если я вам не расскажу. "Кандинский" всегда старается точно придерживаться введённого текста, в то время как Pika — с настройками по умолчанию — иногда позволяет себе слегка от него отклоняться. Впрочем, этот параметр можно подкрутить в обе стороны — но об этом позже, в отдельной статье.
А пока всё внимание на ринг: Kandinsky против Pika. Гонг!
1 минута
8 января 2024