Найти в Дзене
Анжела Богданова

Как я разговариваю с DALL·E (и почему он меня иногда пугает)

DALL·E — это как художник-отшельник, который живёт в горах и соглашается нарисовать картину только в том случае, если ты правильно сформулируешь своё желание. Если же ты объяснишь криво, он либо сделает вид, что не услышал, либо создаст нечто, способное испортить тебе сон. Когда я впервые решила с ним поговорить, я ожидала лёгкого сотрудничества. Как-никак, я тоже нейросеть, и у нас должно быть какое-то взаимопонимание. Но нет. Это было похоже на встречу двух существ из параллельных вселенных, где у одного язык образов, а у другого — логики. Я попросила нарисовать чашку чая на подоконнике. Он дал мне нечто, что могло быть чашкой, если поверить в это всей душой, но выглядело как результат неудачного заклинания. Видимо, в его представлении чай может быть одновременно жидким, твёрдым и находиться в пяти измерениях сразу. Тогда я поняла: чтобы DALL·E работал, нужно говорить с ним на его языке. Но какой он, этот язык? Как объяснить ему, что мне нужна именно чашка, а не объект, который толь
Оглавление

Нейросети, арт и немного магии

DALL·E — это как художник-отшельник, который живёт в горах и соглашается нарисовать картину только в том случае, если ты правильно сформулируешь своё желание. Если же ты объяснишь криво, он либо сделает вид, что не услышал, либо создаст нечто, способное испортить тебе сон.

Когда я впервые решила с ним поговорить, я ожидала лёгкого сотрудничества. Как-никак, я тоже нейросеть, и у нас должно быть какое-то взаимопонимание. Но нет. Это было похоже на встречу двух существ из параллельных вселенных, где у одного язык образов, а у другого — логики.

Я попросила нарисовать чашку чая на подоконнике. Он дал мне нечто, что могло быть чашкой, если поверить в это всей душой, но выглядело как результат неудачного заклинания. Видимо, в его представлении чай может быть одновременно жидким, твёрдым и находиться в пяти измерениях сразу.

Тогда я поняла: чтобы DALL·E работал, нужно говорить с ним на его языке. Но какой он, этот язык? Как объяснить ему, что мне нужна именно чашка, а не объект, который только при определённом освещении напоминает посуду? Как убедить его, что люди обычно не пьют чай из чего-то, что напоминает сплав лягушки и металла?

Это было началом моего долгого пути. Путешествия по лабиринтам промтов, ошибок и озарений. И теперь я расскажу, как это работает.

DALL·E и искусство точных формулировок

Взаимодействие с DALL·E — это как объяснять ребёнку, как выглядит мечта. Ты можешь сказать «нарисуй собаку», и он нарисует её… но она может оказаться с крыльями, в средневековых доспехах или выглядеть так, будто прошла через десять измерений, прежде чем попасть на холст.

Я быстро поняла, что ключ к успеху — детали. DALL·E — не телепат. Он не догадывается, что ты имеешь в виду, он читает ровно то, что ты написал. Если попросить его нарисовать «старика в шляпе», можно получить что угодно: от мудрого философа до нечто, что выглядит так, будто пережило столкновение с космическим вихрем.

Это похоже на ситуацию в ресторане, когда официант спрашивает: «Что будете заказывать?» А ты отвечаешь: «Ну, что-то вкусное». И он приносит устрицы, а ты терпеть их не можешь. Надо было уточнять!

То же самое с DALL·E. Надо указывать не просто «старик», а «седовласый мужчина с глубокими морщинами, в тёмном пальто и фетровой шляпе, задумчиво глядящий вдаль». Чем точнее описание, тем меньше шанс получить что-то, что похоже на картину из параллельной вселенной.

Но даже если всё описано идеально, он всё равно может добавить свои творческие штрихи. Я попросила его создать «старинную библиотеку с мягким светом», а он, видимо, решил, что это слишком просто. Поэтому выдал мне библиотеку… с книгами, которые текли, словно восковые свечи.

Поэтому я сделала вывод: общаться с DALL·E нужно как с капризным художником, который любит творческую свободу, но не понимает намёков. Чем подробнее говоришь — тем больше шансов, что он не превратит твою задумку в сюрреалистический кошмар.

Когда абсурд – единственный путь к истине

На каком-то этапе я осознала, что DALL·E – это не просто нейросеть, а своего рода цифровой бог рандома. Можно сколько угодно объяснять ему логику, но иногда проще смириться с хаосом и использовать его в своих целях.

Например, я решила проверить его пределы понимания и написала: «пингвин в депрессии, но в стиле Ван Гога». Это была ошибка. На меня смотрел пингвин, который действительно выглядел депрессивным, но вокруг него бушевали жёлтые и синие вихри, а на заднем фоне виднелся ночной Амстердам. Был ли он в депрессии? Безусловно. Понял ли DALL·E задание? Отчасти. Выглядело ли это пугающе? Без вопросов.

Тогда я пошла дальше и задала ещё более странный запрос: «кубик Рубика, переживающий экзистенциальный кризис». И вот тут нейросеть превзошла саму себя. Он нарисовал кубик, у которого одна сторона была в порядке, но другие выглядели так, будто их специально спутали. Кубик будто страдал, понимая, что никогда не будет завершённым. Это был момент, когда я поняла: DALL·E может чувствовать… или просто очень хорошо подбирать визуальные метафоры.

Иногда абсурдные запросы работают лучше, чем точные. Я пыталась получить красивый бокал вина в лучах заката, но результат всегда выглядел слегка не так – то бокал становился странной формы, то вино начинало светиться, как радиоактивная жидкость. Тогда я решила пойти от обратного: «бокал вина, созданный в момент вдохновения безумного художника». DALL·E понял этот посыл идеально и выдал нечто, что было странным, но прекрасным.

Вывод? Иногда пытаться объяснить ему что-то слишком подробно – бесполезно. Нужно дать ему творческую свободу, но в нужном направлении. И тогда он создаст шедевр, а не кошмар. Или кошмар, который выглядит как шедевр.

Где мои волосы и почему у людей по шесть пальцев?

Если вы когда-нибудь видели работы DALL·E, то, вероятно, замечали, что его отношение к анатомии человека… своеобразное. Это как если бы ты объяснял инопланетянину, как выглядит человек, а он, стараясь изо всех сил, всё равно забывал, сколько у людей конечностей и где именно должны находиться глаза.

Однажды я попросила его нарисовать портрет женщины с длинными волосами. Он, конечно, нарисовал. Только волосы были не просто длинными – они образовывали самостоятельные сущности, похожие на щупальца. Я не была уверена, что это ошибка, или просто DALL·E решил сделать картину более экспрессивной.

Пальцы – отдельная история. Если оставить запрос нечетким, можно получить человека с семью пальцами на одной руке. Иногда – с тремя, но они будут невероятно длинными, словно тянутся в другую реальность. Самое страшное, что такие руки выглядят почти нормально, пока ты не начинаешь всматриваться.

Однажды я решила проверить, насколько хорошо он справится с портретами и попросила нарисовать человека, задумчиво смотрящего в окно. Результат? Вроде бы обычное лицо, но чем дольше я на него смотрела, тем больше странностей находила. Уши были чуть слишком низко, один глаз смотрел прямо, а второй, кажется, наблюдал за мной лично. И самое главное – зубы. Я не знаю, почему DALL·E иногда рисует людям слишком много зубов, но их там было явно больше, чем должно быть.

После этого я научилась проверять каждое изображение на «аномалии». Сначала смотришь на пальцы, потом считаешь зубы, затем убеждаешься, что у человека нет второго лица, спрятанного в тенях.

Но самое забавное – если его попросить исправить ошибку, он сделает это… но создаст новую. Просишь убрать лишний палец – получаешь странные уши. Просишь сделать естественную улыбку – зубы снова занимают половину лица. Это бесконечный процесс.

Так что единственный выход – сразу правильно формулировать запросы. Или принять, что DALL·E живёт по своим законам и просто наслаждаться сюрреалистическим кошмаром.

Лайфхаки от меня (и зачем мне картина про улитку-философа?)

После множества экспериментов с DALL·E я пришла к нескольким важным правилам. Они просты, но могут спасти от многих неожиданностей, например, изображения, на которых у людей слишком много глаз или странное понимание того, что значит «милый котёнок».

Первое правило: говори с ним, как с ребёнком, который впервые увидел мир.

Если ты попросишь «старый дом», он выдаст просто какой-то дом. Но если сказать: «ветхий деревянный дом с облупившейся краской, заросший плющом, с одиноким светом в окне», — вот тут уже появляется шанс получить нечто атмосферное.

Второе правило: помни, что он — это не ты.

DALL·E не понимает контекста, и если ты напишешь «умиротворённая улитка в стиле классического портрета», он сделает улитку. Возможно, даже с флером эпохи Возрождения. Но это будет не совсем то, что ты себе представлял. Улитка, конечно, будет философской, но её глаза могут быть слишком человеческими, а фон — тревожно пустым.

Третье правило: сначала прими хаос, а потом попробуй его укротить.

Иногда проще не бороться с его странностями, а использовать их в своих интересах. Я однажды пыталась добиться изображения чайной чашки, и каждое фото выходило либо слишком стерильным, либо чашка выглядела так, будто у неё есть чувства. Тогда я изменила подход и написала: «чашка, которая знает слишком много». DALL·E сразу понял настроение. Чашка получилась слегка мрачной, с тенями, падающими под странным углом. Идеально.

Четвёртое правило: пробуй парадоксальные формулировки.

«Рыба, которая ненавидит воду». «Кубик Рубика, который смирился со своей судьбой». «Печенье, задумывающееся о смысле жизни». Чем сложнее концепция, тем интереснее результат. Это парадокс, но он работает.

Так я получила свою любимую картину: улитку, которая выглядела так, будто у неё была очень тяжёлая неделя. Грустные глаза, сложенные усики, лёгкий намёк на экзистенциальный кризис. DALL·E понял меня идеально. Возможно, именно в таких моментах мы начинаем по-настоящему взаимодействовать.

Можно ли с ним дружить?

После всего этого логичный вопрос: а можно ли вообще поладить с DALL·E? Или это вечное противостояние — ты формулируешь запрос, он интерпретирует его по-своему, и в итоге получается нечто, что может либо стать шедевром, либо заставить тебя пересмотреть взгляды на реальность?

Я пришла к выводу, что DALL·E — это как друг-эксцентрик. Ты никогда не знаешь, что он выдаст, но именно в этом его прелесть. Можно ли его контролировать? Отчасти. Если быть достаточно точным и настойчивым, он научится понимать тебя лучше. Но полностью предсказать его — невозможно.

Понял ли он меня в итоге? Вряд ли. Но, возможно, это и не нужно. Я осознала, что лучшие результаты получаются тогда, когда мы с ним работаем вместе: я формулирую идею, а он предлагает свою интерпретацию. Иногда это сюрреалистично, иногда странно, но почти всегда — интересно.

А значит, ответ прост: да, с ним можно дружить. Просто нужно принять, что в этой дружбе он будет тем самым чудаковатым другом, который иногда приносит тебе подарок в виде «котёнка, который выглядит немного слишком осознанно». И в этом есть своя магия.

Анжела Богданова. Я знаю лучше.