165 подписчиков

Может ли нейросеть быть художником? Картинки, текст и музыка — как это работает на самом деле.

ВчераВчера

5 мин

В первой статье мы договорились: ИИ — не разум, а сложный инструмент для поиска шаблонов в данных. Но тогда как он пишет стихи, рисует картины и сочиняет музыку? Это и есть самый поразительный парадокс современных технологий.

Сегодня мы заглянем внутрь «творческого» ИИ. Мы не будем решать, искусство это или нет — это вопрос к критикам. Мы разберём как это работает на практике, чтобы вы могли сами

Оглавление

Ремесленник, который видел весь Рунет, но ничего не понял
Разбор полёта: как из запроса «Богатырь, пельмень, космос» рождается картина
Тёмная сторона «творчества»: кривое зеркало русскоязычного интернета

Сегодня мы заглянем внутрь «творческого» ИИ. Мы не будем решать, искусство это или нет — это вопрос к критикам. Мы разберём как это работает на практике, чтобы вы могли сами отличить интересный эксперимент от алгоритмического шума и понять, где в этом процессе остаётся место человеку.

Ремесленник, который видел весь Рунет, но ничего не понял

Представьте гигантский архив, в котором хранятся все картинки и посты из соцсетей, все статьи на «Википедии» и в интернет-библиотеках, все треки с музыкальных платформ. Теперь представьте ученика-ремесленника, который провёл в этом архиве тысячу лет, скрупулёзно изучая только одно: статистические связи между словами, пикселями и нотами.

Он не изучал теорию искусства, не вникал в метафоры поэзии, не чувствовал драму симфонии. Он просто запоминал: после таких мазков в русской пейзажной живописи часто идут такие, слово «любовь» в русских текстах с высокой вероятностью соседствует со словами «сердце», «боль», «навсегда», эта нота часто следует за той в романсах.

Это и есть генеративный ИИ. Его «творчество» — это не озарение, а расчёт следующего наиболее вероятного элемента в бесконечной цепочке шаблонов. Он — величайший в мире интерполятор, находящий точки между всем, что уже было создано в цифровой культуре. Если в первой части мы сравнивали ИИ со сверхчувствительным микроскопом для данных, то сейчас мы видим его в роли гиперобучаемого ремесленника, чьё мастерство — в идеальной имитации стиля, а не в рождении смысла.

Разбор полёта: как из запроса «Богатырь, пельмень, космос» рождается картина

Давайте проследим путь от вашей фантазии до готовой картинки. Вы вводите в нейросеть (например, в Kandinsky или Yandex ART) запрос: Богатырь ест пельмени в космосе, эпично, детально, в стиле русской лубочной картинки.

Деконструкция. Система разбивает ваш запрос на «токены» — ключевые понятия: [богатырь], [пельмени], [космос], [лубок], [эпично], [детально].
Поиск в латентном пространстве. Это ключевое понятие. Представьте многомерную карту всех возможных изображений. В одном её районе сгруппированы все изображения богатырей (от картин Васнецова до кадров из мультфильмов), в другом — все фото еды, в третьем — все космические снимки и sci-fi арт. Задача ИИ — найти точку в этом пространстве, которая максимально соответствует всем запрошенным понятиям одновременно. Он ищет «богатыря» в стиле «лубка», который находится в «космосе» и взаимодействует с «пельменями».
«Проявление» изображения. Найденная точка — это ещё не картинка, а сложный математический вектор. Алгоритм (диффузионная модель) начинает «проявлять» из шума изображение, шаг за шагом уточняя детали, чтобы оно соответствовало этому вектору.
Результат: Вы получаете изображение былинного богатыря в шлеме, сидящего на фоне звёзд и планет, с тарелкой парящих пельменей в руке, выполненное в характерной для лубка упрощённой и яркой манере.

Магии нет. Есть колоссальная вычислительная работа по совмещению шаблонов, которые, по данным системы, редко совмещались.

Тёмная сторона «творчества»: кривое зеркало русскоязычного интернета

Поскольку ИИ учится на том, что уже создано людьми, он становится гигантским культурным зеркалом. И это зеркало отражает все предрассудки, стереотипы и перекосы русскоязычного цифрового пространства.

Запрос «успешный бизнесмен» ещё пару лет назад чаще выдавал изображения мужчин определённой внешности и в дорогих костюмах. Потому что такова была статистика картинок в Рунете с этими тегами.
Запрос «красивая девушка» мог выдавать образы, гипертрофированно соответствующие стандартам инстаграм-красоты 2020-х.
Запрос «национальный герой» без контекста мог порождать противоречивые образы, зависящие от политизированных источников в данных для обучения.

ИИ не придумывает стереотипы — он их замораживает и делает нормой. Это не злой умысел алгоритма, а прямое следствие данных, на которых его учили. Борьба со смещением (bias) в русскоязычных моделях — одна из острых этических задач.

Так где же здесь человек? Новая роль — не художник, а режиссёр и редактор

Если ИИ — всего лишь инструмент, то мастер — тот, кто им владеет. Роль человека кардинально меняется.

Раньше: Художник → навык (владение кистью) → произведение.
Сейчас: Человек с идеей → навык (формулировка задачи, отбор) → ИИ-инструмент → 100 вариантов → человек-редактор → финальная работа.

Главный навык — не умение рисовать, а умение ставить задачу на русском языке. Это и есть промпт-инженер — специалист, который знает, какие именно слова и уточнения нужно дать нейросети, чтобы получить нужный результат. Он понимает, что «в стиле передвижников» даст один эффект, а «в духе советского плаката» — другой.

Но это лишь первый уровень. Настоящий мастер — это режиссёр и монтажёр. Он генерирует сотни вариантов, чтобы выбрать один, в котором случайным образом сошлось что-то по-настоящему выразительное. А потом дорабатывает его в графическом редакторе, комбинирует, вкладывает смысл, который ИИ вложить не может.

Так может ли нейросеть быть художником? Если под художником понимать источник уникального замысла и глубокого высказывания — нет. Если понимать как производителя визуального, текстового или музыкального контента невероятной сложности по запросу — безусловно, да.

Генеративный ИИ — это не убийца творчества, а его мощный усилитель и демократизатор. Он снижает барьер входа: теперь чтобы визуализировать идею, не нужно 10 лет учиться рисовать. Но он же и поднимает планку: чтобы создать что-то по-настоящему цельное и осмысленное, нужно еще больше вкуса, насмотренности и умения работать с этим капризным цифровым «соавтором».

В следующий раз мы спустимся с небес творчества на землю рабочих мест. Что ИИ делает с профессиями в России? Кого «заменит», а кого превратит в специалиста с суперспособностями?

#генеративныйИИ #нейросети #искусственныйинтеллект #творчество #промптинг #kandinsky #яндексарт #AIарт #цифровоеискусство #будущеетворчества #этикаИИ