В начале июня обновился авторитетный рейтинг нейросетей Text-to-Image Arena. На второе место в мире неожиданно поднялась новая модель Reve 2.0, потеснив привычных лидеров индустрии. Проект привлек внимание профессионального сообщества тем, что предлагает принципиально иной подход к созданию изображений, полностью отличающийся от привычной логики Midjourney или генератора от Илона Маска.
В чем главная фишка обновления
Большинство современных ИИ-генераторов работают как лотерея. Вы пишете длинный текст, нажимаете кнопку и надеетесь, что алгоритм правильно поймет ваши слова. Но стоит попросить подвинуть чашку на столе чуть левее или заменить кота на собаку, как нейросеть полностью перерисовывает весь кадр, меняя освещение, стиль и композицию.
Разработчики Reve 2.0 решили эту проблему через внедрение системы цифровых макетов (layouts). Для этой модели картинка — это не случайный набор пикселей, а структурированная база данных, похожая на программный код.
Процесс генерации теперь строится следующим образом:
* Сначала система размечает виртуальный холст на зоны.
* Каждому объекту присваиваются конкретные геометрические координаты и размеры.
* Нейросеть прописывает текстовое описание для каждого отдельного участка, а не для всей картинки сразу.
Благодаря этому пользователь получает полный контроль над результатом. Если вам нужно изменить цвет кроссовок у персонажа, модель перерисует только эту область, оставив фон, лицо и общую атмосферу нетронутыми.
Основные технические преимущества
Такой инженерный подход позволил избавиться от главных болячек современных ИИ-генераторов.
Отсутствие артефактов при высоком разрешении. Обычно нейросети создают маленькую картинку, а потом искусственно растягивают ее. Из-за этого на заднем плане часто появляется размытие или странные пятна. Reve 2.0 сразу формирует изображение в нативном разрешении 4K, прорисовывая текстуры на микроуровне.
Корректная работа с текстом. Вписать вывеску магазина или принт на футболку для обычных моделей — сложная задача, буквы часто превращаются в кашу. Новая система четко знает границы объекта, поэтому надписи получаются ровными, читаемыми и с правильной перспективой.
Предсказуемость композиции. Объекты больше не накладываются друг на друга случайным образом. Если в макете указано, что машина стоит справа, а дерево слева, они окажутся именно там с точностью до пикселя.
Где и как протестировать
На данный момент проект находится в стадии активного развертывания, поэтому привычных мобильных приложений в маркетах пока нет. Весь функционал доступен через веб-интерфейс в браузере.
Полноценный доступ к движку открыт на официальном сайте разработчиков по адресу reve.ai. Там можно опробовать инструмент в действии, посмотреть примеры разметки холста и оценить скорость генерации.
Также модель интегрирована в общую систему тестирования искусственного интеллекта на платформе lmarena.ai. В соответствующем графическом разделе этого сайта можно принять участие в слепом тестировании, сравнивая результаты Reve 2.0 с конкурентами на одинаковых запросах.
Кому это пригодится в работе
Новый инструмент ориентирован в первую очередь на тех, кому важна точность, а не случайная красота:
* Дизайнеры интерфейсов. Теперь можно быстро собирать концепты сайтов и мобильных приложений, где все кнопки, иконки и текстовые блоки стоят строго на своих местах.
* Специалисты по рекламе. Появляется возможность массово создавать баннеры, оперативно меняя на них товары или рекламные лозунги без необходимости генерировать всю сцену заново.
* Контент-мейкеры. С помощью жесткой фиксации макета проще создавать серийные иллюстрации для статей или комиксов, сохраняя единый стиль и пропорции персонажей от кадра к кадру.
Пока технология только начинает масштабироваться, но изменение самого принципа генерации показывает, в каком направлении будет развиваться компьютерная графика в ближайшие годы. Выход Reve 2.0 подтверждает, что индустрия постепенно переходит от развлекательных инструментов к предсказуемым рабочим сервисам.