Русский язык она понимает просто чудесно. И это не просто очередной ИИ генератор картинок - это «думающая» нейросеть, которая объединяет логическое рассуждение (reasoning) и генерацию пикселей в едином процессе. Основная проблема современных нейросетей — разрыв между пониманием текста и созданием изображения. Обычно одна модель (LLM) интерпретирует запрос, а другая (Diffusion) рисует. Uni-1 работает иначе (Autoregressive Transformer): модель одновременно оперирует и языковыми токенами, и токенами изображений. Она буквально «продумывает» композицию и детали в текстовом виде, прежде чем превратить их в пиксели, что позволяет достичь беспрецедентной точности в сложных сценах. В отличие от конкурентов, Uni-1 имеет пространственный интеллект, то есть понимает физику и геометрию. Если вы попросите «положить яблоко внутри прозрачного куба, который стоит на краю стола», нейросеть не просто нарисует похожие объекты, а выстроит их логическую взаимосвязь. Uni-1 справляется с рендерингом надписей
Компания Luma AI представила Uni-1 — первую мультимодальную модель на базе архитектуры Unified Intelligence для создания изображений
ВчераВчера
3
2 мин