Больше новостей об IT в Telegram канале «Код Дурова»
WAN — одна из самых заметных open-source моделей для генерации видео, и ее открытая экосистема принципиально отличает сервис от Kling, Runway, Pika и других закрытых платформ.
Здесь не просто выдают инструмент, а публикуют сами нейросети, которые можно скачать, запустить на своем компьютере и дообучить под конкретную задачу. Используют WAN не только для генерации роликов с нуля, но и для анимации персонажей, редактирования видео и сборки локальных пайплайнов через Hugging Face, GitHub и ComfyUI.
Разбираем, что реально умеет WAN, какие режимы стоит использовать под конкретную задачу. В отдельном блоке расскажем, как пользоваться сервисом из России и не потерять доступ к аккаунту из-за блокировок и платежных ограничений.
Обзор WAN: какие есть модели, параметры и версии
WAN, или Wan2.x, — семейство больших генеративных видеомоделей, принадлежащее Alibaba и Wan Team. Открытая экосистема включает несколько версий: Wan2.1, Wan2.2, отдельные модели для text-to-video, image-to-video, video-to-video, анимации, S2V и Diffusers-варианты. На Hugging Face у Wan-AI собраны отдельные коллекции Wan2.1, Wan2.2 и Wan2.2-diffusers.
Согласно научному отчету о WAN, нейросеть описывается как открытая серия крупномасштабных видеогенеративных моделей. Есть две основные версии: меньшая — на 1,3 миллиарда параметров, она лучше подходит для обычных видеокарт, в том числе тех, что устанавливают в игровые компьютеры, и более крупная — на 14 миллиардов параметров, дающая более качественное видео, но требующая мощного оборудования.
Важно понимать: WAN — это набор моделей и способов запуска. Можно использовать готовый интерфейс и за пару кликов сделать короткое видео из картинки. А можно установить модель локально, встроить ее в ComfyUI и собрать собственный пайплайн для серийной генерации. От выбранного способа доступа напрямую зависит и то, какие риски для аккаунта и платежей возникнут в будущем.
Как устроен интерфейс WAN
Внешний вид интерфейса зависит от площадки: официальный сайт, сторонний веб-сервис, Hugging Face, ComfyUI или локальный запуск. Но логика работы почти везде одинакова — нужно выбрать режим, задать промпт, настроить формат ролика и запустить генерацию.
В стандартном веб-интерфейсе можно выделить шесть ключевых зон.
- Выбор режима. Для видео чаще всего используют text-to-video и image-to-video.
- Поле промпта. Сюда вписывают визуальные параметры: camera movement, angle, lens, lighting, color grading, style, what to preserve. Чем точнее описаны камера, свет и ограничения, тем меньше деталей модель додумывает самостоятельно.
- Negative prompt. Это поле помогает убрать типовые ошибки генерации: лишний текст, логотипы, деформации лица, нестабильный фон, мерцание и изменение формы объекта.
- Формат видео. Здесь выбирают aspect ratio: 9:16 — для Reels (принадлежит Meta, признанной экстремистской и запрещённой в РФ), Shorts и TikTok; 16:9 — для YouTube, сайта и презентаций; 1:1 или 4:5 — для ленты. Формат лучше определить заранее, до запуска генерации.
- Длительность и качество. Короткие ролики получаются стабильнее длинных. Для AI-видео разумнее генерировать сцены по 3–5 секунд: один объект, одно движение камеры, одно действие. Длинный ролик в итоге надежнее собрать монтажом из нескольких коротких фрагментов.
- Seed и вариации. Seed позволяет повторить похожий результат или получить близкие версии удачного кадра. Если ролик почти получился, точечнее менять промпт и зафиксировать seed.
Тарифы и лимиты WAN: на что смотреть перед оплатой
Free (бесплатно)
Подходит для знакомства с сервисом и нерегулярного использования: отправка до 1 видео и 1 изображения одновременно, доступ к 6 стилям изображений, неограниченная генерация без расходования кредитов.
Pro ($5 в месяц, при годовой оплате — скидка 50%; полная цена — $10 в месяц)
Самый популярный план, баланс цены и возможностей: 300 кредитов в месяц, ускорение генерации до 1200 изображений или 60 видео, отправка до 3 видео и 3 изображений одновременно, создание видео в 1080p и увеличенной длительности (10 и 15 секунд), апскейл изображений, доступ ко всем стилям, скачивание без водяных знаков, неограниченная генерация без кредитов.
Premium ($20 в месяц, при годовой оплате — скидка 50%; полная цена — $40 в месяц)
Максимальный план для активной работы и коммерческих задач: 1200 кредитов в месяц, ускорение генерации до 4800 изображений или 240 видео, отправка до 8 видео и 5 изображений одновременно, скачивание без водяных знаков, 1080p и увеличенная длительность, апскейл, все стили, неограниченная генерация без кредитов.
Важный нюанс: это стоимость исключительно подписки. Чтобы пользоваться нейросетью комфортно, придется также оплатить качественный VPN, купить зарубежную почту, номер телефона и банковскую карту. Или использовать агрегаторы, где все это уже сделали за вас.
Неограниченная генерация без кредитов есть во всех планах, но выполняется в стандартной очереди, поэтому скорость там ниже, чем при расходовании кредитов. Именно платная подписка — Pro или Premium — чаще всего и становится точкой риска для аккаунта пользователей из России, о чем подробнее ниже.
Способы доступа к WAN
Есть пять практических способов получить доступ к нейросети.
1. Официальный сайт Wan
Самый простой путь, чтобы протестировать text-to-video, image-to-video и image editing, если сайт открывается и нужный функционал доступен.
2. Hugging Face
На этой площадке собирают и публикуют готовые нейросети, наборы данных и мини-программы для них. Доступны модели Wan-AI, включая Wan2.2-T2V, Wan2.2-I2V, Wan2.2-S2V, Wan2.2-Animate и Diffusers-версии. Подходит тем, кто хочет разобраться, какие модели существуют, протестировать демо или использовать веса в своем окружении.
3. GitHub
Здесь хранят и совместно редактируют код. Репозитории Wan2.1 и Wan2.2 нужны для локального запуска, экспериментов, настройки окружения и интеграции в собственные пайплайны.
4. ComfyUI
Программа для генерации картинок, а иногда и видео, с помощью нейросетей. Хороший вариант для креаторов и технических специалистов, которые собирают workflow из узлов: генерация изображения, image-to-video, апскейл, интерполяция, цвет, постобработка.
5. Агрегаторы
Подходят тем, кому нужен результат без VPN, без локальной настройки, скачивания весов и работы с зависимостями — и без рисков, связанных с прямой оплатой иностранному сервису.
Основные режимы WAN
У WAN есть несколько рабочих режимов, каждый из которых решает свою задачу и требует отдельного подхода к промпту.
Text-to-video
Ггенерация видео по текстовому описанию. Пользователь описывает сцену, действие, камеру, свет, стиль и ограничения, а модель создает короткий ролик. Подходит для визуальных концептов, коротких сцен, mood-видео, фонов, b-roll, рекламных черновиков, превизов, идей для Reels (принадлежит Meta, признанной экстремистской и запрещённой в РФ), Shorts и Telegram, теста визуального направления до съемки.
Хуже справляется с задачами, где нужно сохранить конкретного персонажа, точный продукт, фирменный стиль или композицию: модель сама придумывает кадр, и результат может оказаться красивым, но не совпасть с задачей.
Пример промпта:
«Черный электромобиль едет по мокрой ночной улице, отражения неоновых вывесок на асфальте, медленное движение камеры сбоку, реалистичный стиль, кинематографичный свет, без текста, без логотипов, без деформации колес».
Image-to-video
Самый полезный режим для большинства креаторов. Пользователь сначала создает или загружает исходный кадр, а затем просит WAN оживить его. Этот режим дает больше контроля, чем text-to-video, поскольку композиция, персонаж, продукт, фон, цвет, стиль и ракурс уже заданы заранее, а модель отвечает в основном за движение.
Подходит для оживления портретов, product shot, анимированных обложек, motion-креативов, оживления изображений из Midjourney, Flux или Stable Diffusion, коротких видео для соцсетей, заставок, визуальных тестов для рекламы, оживления concept art, легкого движения камеры в статичной сцене.
Пример промпта:
«Оживи исходное изображение: камера медленно приближается, волосы слегка двигаются от ветра, фон остается стабильным, лицо не менять, одежду не менять, стиль и композицию сохранить».
Главное правило: если важен контроль, начинать стоит не с text-to-video, а с сильного исходного изображения.
Video-to-video и редактирование
Подходит, когда ролик уже есть, но нужно изменить стиль, усилить движение, сделать вариацию сцены или преобразовать видео в другой визуальный формат. В Wan2.2 на Hugging Face реализованы Animate- и video-to-video-направления, а в экосистеме Wan упоминается также instruction-guided video editing.
Полезен для стилизации ролика, чернового превиза, изменения атмосферы, создания вариаций, анимации персонажа, теста движения перед продакшном, превращения статичного или слабого видео в более выразительный вариант.
Режим требует контроля, поскольку модель может изменить больше, чем нужно: лицо, одежду, фон, пропорции, фактуру объекта. В промпте важно прямо прописывать, что должно остаться неизменным.
Пример:
«Сохрани композицию, лицо, одежду и положение персонажа. Измени только стиль света: сделать сцену более холодной, добавить мягкий контровой свет, не менять фон и пропорции тела».
Animate (Wan2.2-Animate)
Направление для анимации и video-to-video-сценариев, нужное преимущественно для персонажной анимации, оживления поз, движения тела, сцен с человеком и controlled animation. Лучше прописывать конкретную задачу: что должно двигаться, что должно остаться стабильным, какие элементы нельзя менять.
Пример:
«Анимируй персонажа: легкий поворот головы вправо, моргание, небольшое движение плеч, камера статична, фон не менять, лицо и прическу сохранить».
S2V (Wan2.2-S2V)
Связан со Speech-to-Video и audio-driven digital human video. Портретные фото с помощью этого режима превращаются в аватары, которые говорят, поют и двигаются. S2V применяют в сценариях, где есть изображение человека и аудио: говорящий аватар, обучающее видео, короткий ролик с ведущим, digital human для продукта, тест персонажа перед продакшном, локализация ролика с новым голосом, прототип видеоинструкции.
Как писать промпт для WAN
Хороший промпт должен задавать управляемую сцену. Рабочая формула: объект → действие → сцена (где все происходит) → настройки камеры → свет → стиль → ограничения.
Пример полного промпта:
«Матовый черный флакон духов на стеклянной поверхности в минималистичной студии. Медленный поворот флакона на 15 градусов, камера слегка приближается, мягкий студийный свет, реалистичный стиль, отражение на поверхности. Без текста, без логотипов, без рук в кадре, форму флакона не менять».
Кому действительно нужен WAN
WAN подходит не всем. Он полезен AI-креаторам, которые делают короткие ролики, дизайнерам, которым нужно оживлять визуалы, motion-специалистам для быстрых тестов, маркетологам для креативных гипотез, редакциям для визуальных вставок, продакшн-командам для превиза, разработчикам для open-source video pipeline, студиям, которые хотят контролировать генерацию, и тем, кто уже работает с ComfyUI.
WAN — не лучший выбор, если нужно одно финальное видео без отбора дублей, длинная сложная сцена, стабильный персонаж на протяжении минуты, точный текст в кадре или гарантированный результат с первого промпта.
Как защитить аккаунт WAN от блокировок при использовании из России
Главный источник риска для аккаунта в открытой экосистеме WAN — не сама модель, а способ оплаты и привязки доступа. У сервиса нет единого централизованного аккаунта, как у закрытых платформ: доступ может идти через официальный сайт с подпиской, через личный токен на Hugging Face, через GitHub-аккаунт для клонирования репозиториев или через сторонний агрегатор. Каждый из этих способов несет свой тип риска для блокировки.
При работе через официальный сайт Wan основной риск связан с оплатой Pro и Premium тарифов: подписка завязана на карту, и при оплате иностранной картой через VPN сервисы платежного скрининга иногда фиксируют несовпадение геолокации карты, IP-адреса и предполагаемого региона аккаунта. Это может привести к временной заморозке подписки до подтверждения личности или к полной потере доступа к оплаченным кредитам без возврата средств. Чтобы снизить этот риск, стоит использовать стабильный IP без частой смены региона на время действия подписки и не переключать VPN-локацию в процессе оплаты или сразу после нее.
Риски при работе с Hugging Face и GitHub: эти площадки требуют верификации через email и иногда телефон, а резкая активность — массовое скачивание весов моделей, частые обращения к API через нестабильный VPN — может расцениваться автоматическими системами как подозрительная и приводить к временной блокировке аккаунта для проверки. Чтобы этого избежать, стоит привязывать к аккаунтам действующую почту, не делать массовые параллельные запросы с одного IP и постепенно наращивать активность вместо разовых пиковых нагрузок.
При локальном запуске через ComfyUI или Diffusers риска для блокировки аккаунта как такового нет, поскольку модель и веса хранятся локально, а не в облачном сервисе с привязкой к подписке. Это делает локальный запуск самым устойчивым к блокировкам способом использования WAN, хотя и самым требовательным к техническим навыкам и мощности оборудования.
Отдельный практичный вариант — использование агрегаторов, которые берут на себя вопрос оплаты и доступа: подписка оформляется напрямую через локальные способы оплаты, без привязки иностранной карты к аккаунту и без VPN на этапе платежа, что снимает основной риск блокировки именно платежной части.
Вывод
WAN — один из самых интересных инструментов для AI-видео, потому что это не только генератор роликов, а целая модельная экосистема. Через него можно делать text-to-video, image-to-video, video-to-video, анимацию, S2V-сценарии и локальные пайплайны.
Для пользователя из России доступ к WAN открывается несколькими путями — официальный сайт, Hugging Face, GitHub, ComfyUI или агрегаторы, — и у каждого свой профиль риска для аккаунта. Самый устойчивый к блокировкам вариант — локальный запуск, самый удобный по балансу риска и простоты — оплата через агрегатор без привязки иностранной карты.
Для рабочих задач лучше начинать с image-to-video, коротких сцен, понятного движения камеры, сильного исходного кадра и жестких ограничений в промпте. WAN хорошо подходит для концептов, motion-креативов, превизов, b-roll и коротких визуальных сцен, но не заменяет полноценный продакшн и почти всегда требует отбора дублей.
Через SpeShu.AI доступны WAN и более 300 других мировых моделей без VPN и без иностранной карты — это сужает поверхность риска до самого сервиса-агрегатора, а не до отдельного аккаунта на каждой из площадок. Для читателей действует промокод KODTSNIS, который дает +15% на счет агрегатора.
Больше новостей об IT в Telegram канале «Код Дурова»