Добавить в корзинуПозвонить
Найти в Дзене
Страницы науки

Нейросети в искусстве: творчество или имитация?

В 2014 году исследователь Ян Гудфеллоу представил миру концепцию генеративно-состязательных сетей (GAN) — архитектуры, которая навсегда изменила представление о возможностях машин в искусстве. GAN состоит из двух нейронных сетей, играющих в бесконечную игру: генератор создаёт изображения, а дискриминатор пытается отличить их от настоящих. Это состязание напоминает древнегреческую agon — ритуальное соревнование, порождающее совершенство через противоборство. Историческая веха наступила в октябре 2018 года, когда портрет «Эдмонд де Белами», созданный парижским коллективом Obvious с помощью GAN, был продан на аукционе Christie’s за 432 500 долларов. Алгоритм обучили на 15 000 портретах XIV–XX веков, и результат — размытое, почти призрачное изображение мужчины в викторианском костюме — стал символом новой эпохи. Но за этим событием скрывался глубокий парадокс: художники Obvious лишь слегка модифицировали открытый код, созданный другим программистом, Робби Барратом. Вопрос авторства всплыл
Оглавление

Глубокий анализ технологий, философии и права

Часть I. Эволюция машинного творчества: от GANов к диффузионным трансформерам

1.1. Заря эры: GAN и первые шаги (2014–2018)

В 2014 году исследователь Ян Гудфеллоу представил миру концепцию генеративно-состязательных сетей (GAN) — архитектуры, которая навсегда изменила представление о возможностях машин в искусстве. GAN состоит из двух нейронных сетей, играющих в бесконечную игру: генератор создаёт изображения, а дискриминатор пытается отличить их от настоящих. Это состязание напоминает древнегреческую agon — ритуальное соревнование, порождающее совершенство через противоборство.

Историческая веха наступила в октябре 2018 года, когда портрет «Эдмонд де Белами», созданный парижским коллективом Obvious с помощью GAN, был продан на аукционе Christie’s за 432 500 долларов.

Портрет «Эдмонд де Белами», созданный парижским коллективом Obvious с помощью GAN
Портрет «Эдмонд де Белами», созданный парижским коллективом Obvious с помощью GAN

Алгоритм обучили на 15 000 портретах XIV–XX веков, и результат — размытое, почти призрачное изображение мужчины в викторианском костюме — стал символом новой эпохи. Но за этим событием скрывался глубокий парадокс: художники Obvious лишь слегка модифицировали открытый код, созданный другим программистом, Робби Барратом. Вопрос авторства всплыл сразу — кто настоящий творец: машина, написавшая код, программист, обучивший сеть, или коллектив, выбравший конкретный результат из тысяч вариантов?

К 2017 году зародилось явление, которое критик искусства и куратор Аарон Херцманн назвал «GANизмом» — направлением, где художники начали осознанно использовать генеративные сети как инструмент, а не как автомат замены человека. Анна Ридлер создала серию «Mosaic Virus» (2018), обучив GAN на 10 000 собственных фотографиях тюльпанов, тем самым встроив личный опыт в машинный процесс. Мемо Актен для фильма «Deep Meditations» (2018) обучил модель на изображениях с Flickr, отмеченных абстрактными концепциями — «смысл жизни», «смерть», «любовь» — позволив машине предложить собственную, пугающую интерпретацию коллективного бессознательного человечества.

1.2. Революция диффузии: как работают современные модели (2022–2026)

Современная генерация изображений строится на диффузионных моделях — технологии, коренным образом отличающейся от GAN. Если GAN учатся через соревнование двух сетей, то диффузионные модели осваивают искусство через разрушение и восстановление.

Учиться через хаос. Представьте, что вы смотрите на чёткую фотографию, а затем постепенно добавляете к ней шум — сначала лёгкую зернистость, потом всё больше и больше, пока изображение не превратится в белый шум, похожий на старый телевизор без сигнала. Диффузионная модель проходит этот путь в обратном направлении: она учится «очищать» зашумлённое изображение шаг за шагом, восстанавливая из хаоса структуру и смысл. Это как учиться собирать пазл, но пазл разбрасывается в беспорядок, и вы учитесь находить правильные фрагменты среди миллионов случайных кусочков.

Латентное пространство — сжатая карта смыслов. Ключевое новшество Stable Diffusion (2022) — перенос процесса из мира пикселей в мир сжатых представлений. Модель сначала учится «упаковывать» изображение в компактный код — настолько компактный, что фотография в несколько мегабайт превращается в вектор из нескольких сотен чисел. Этот код хранит не цвета отдельных точек, а высокоуровневые признаки: формы, текстуры, композицию, стиль. Затем диффузия происходит уже в этом сжатом пространстве, а не среди миллионов пикселей. Это снижает вычислительные затраты в десятки раз и позволяет модели работать со смыслами, а не с точками на экране.

Внимание как мост между словами и картинками. Когда пользователь вводит запрос «кот в шляпе на Марсе», модель должна понять, как связать текст с визуальными элементами. Для этого используется механизм внимания — математический инструмент, позволяющий модели «фокусироваться» на конкретных словах запроса при генерации соответствующих частей изображения. Когда модель рисует морду кота, она «смотрит» на слово «кот»; когда добавляет шляпу — на слово «шляпа». Это не сознательное понимание, а сложная статистическая связь, выстроенная на миллионах примеров.

Diffusion Transformers (DiT) — новая архитектура 2026 года. Современные модели, такие как FLUX и обновлённые версии Stable Diffusion, объединяют диффузию с трансформерами — архитектурой, изначально созданной для обработки текста. Трансформеры умеют захватывать дальние связи: например, понимать, что рука на одном краю изображения принадлежит человеку, лицо которого на другом краю. Это улучшает композицию сложных сцен, где много объектов взаимодействуют друг с другом. Время генерации сократилось с полминуты до нескольких секунд, а точность следования запросам возросла на порядок — модели стали лучше понимать сложные описания с множеством деталей.

1.3. Мультимодальные конвейеры и кастомизация

В 2026 году границы между медиа стёрлись. Современные платформы позволяют в рамках одной сессии перейти от текстового описания к изображению, затем к видео и аудио. Это «сжимает производственные таймлайны» — концепция, ранее требовавшая студии с десятками специалистов, теперь доступна индивидуальному создателю.

Персонализация достигла нового уровня через техники LoRA (Low-Rank Adaptation) и Dreambooth. Художник может обучить модель на собственных работах — скажем, 50–100 изображений — и получить инструмент, генерирующий в его уникальном стиле. Это породило феномен «AI-инфлюенсеров» — синтетических персонажей с неизменной визуальной идентичностью, используемых в рекламных кампаниях. Но здесь встаёт вопрос: если модель точно воспроизводит стиль конкретного художника, не становится ли это цифровым плагиатом?

Часть II. Философия машинного творчества: семь теорий

2.1. Теория интенциональности: намерение как сущность творчества

Философы с античности считали, что творчество требует intentionality — направленности сознания на объект. Когда Ван Гог писал «Звёздную ночь», он выражал смятение, надежду, одиночество. Нейросеть не переживает эмоций и не ставит цель выразить состояние. Она оптимизирует математическую функцию потерь.

Но здесь возникает парадокс: мы не можем заглянуть в сознание Ван Гога, мы лишь интерпретируем его намерения через произведение. Если картина нейросети вызывает у зрителя те же эмоции, что и картина человека, различаются ли они онтологически? Философ Бертран Рассел предлагал «теорию описаний», согласно которой смысл высказывания определяется его эффектом, а не внутренним состоянием говорящего. В этом свете различие между «настоящим» и «имитированным» творчеством размывается.

2.2. Теория эмерджентности: когда целое больше суммы частей

В больших моделях проявляются свойства, которых не закладывали создатели. Модели способны к «zero-shot learning» — генерации в стиле, для которого не видели примеров, или написанию кода на языке, не представленном в обучающей выборке. Это напоминает творческий прорыв человека, находящего решение вне заданных рамок.

Исследование Jennings (2010) в Minds & Machines анализирует «искусственные барьеры» в ИИ, указывая, что системы могут преодолевать ограничения через эмерджентное поведение. Однако критики возражают: эмерджентность в нейросетях — это лишь сложная интерполяция в многомерном пространстве параметров, а не истинное творческое открытие.

2.3. Теория случайности: креативность как стохастический процесс

В нейросетях случайность играет структурную роль: начальные веса, шум в латентном пространстве, сэмплирование токенов. Каждый запрос «закат над Токио» даёт уникальный результат. Философы искусства давно спорят о роли случайности в творчестве.

Джон Кейдж в своём знаменитом произведении 4'33" использовал случайные звуки окружающей среды как музыкальный материал, утверждая, что случайность освобождает творчество от воли автора. Для Кейджа случайность была основой творческого акта. Если принять эту логику, нейросети, использующие стохастические процессы, осуществляют творчество в кейджевском смысле.

Но есть и контраргумент: человеческий художник выбирает использовать случайность как метод. Нейросеть не выбирает — случайность встроена в её архитектуру принудительно. Разница между «использованием случайности» и «быть случайностью» фундаментальна.

2.4. Теория кураторства: авторство в эпоху промптов

Создание эффективного промпта — это навык, требующий эстетического вкуса, знания истории искусства и понимания работы алгоритма. Художник Рефик Анадол использует нейросети как инструмент, а не как замену себе. Его творчество заключается в том, чтобы задать правильные вопросы машине.

В проекте «Unsupervised» в MoMA (2021–2023) Анадол использовал 200 миллионов изображений из архивов музея для обучения модели, создающей постоянно меняющиеся визуальные среды. Здесь машина — исполнитель, а человек — композитор, написавший «партитуру» в виде алгоритма. Но кто автор: тот, кто написал код, тот, кто выбрал данные, или тот, кто настроил параметры?

2.5. Теория коллективного разума: нейросеть как зеркало культуры

Нейросети обучаются на данных, созданных миллионами людей. Они являются, по сути, конденсатом человеческого творческого опыта. Когда Midjourney генерирует изображение в стиле «смесь Босха и киберпанка», она не творит из ничего — она рекомбинирует элементы, усвоенные из тысяч работ.

Это напоминает концепцию «коллективного бессознательного» Юнга — архетипических образов, существующих вне индивидуального сознания. Нейросеть становится артефактом культурной памяти, способным воспроизводить и трансформировать архетипы. Но является ли рекомбинация архетипов творчеством? Или это лишь сложная форма цитирования?

2.6. Теория телесности: тело как предпосылка творчества

Феноменолог Морис Мерло-Понти утверждал, что тело — не объект, а субъект восприятия. Художник чувствует вес кисти, сопротивление холста, запах красок. Эта телесная обратная связь формирует творческий процесс.

Нейросеть не имеет тела. Она существует в виде матриц весов на серверах. Но стоит ли телесность считать необходимым условием? Композиторы электронной музыки, такие как Карлхайнц Штокхаузен, создавали произведения, не касаясь физических инструментов. Их тело было вовлечено через интерфейсы — клавиатуры, микшеры, программные среды. Нейросеть — лишь следующий уровень абстракции интерфейса.

2.7. Теория открытия: творчество как решение проблемы

Психологи Роберт Вейсберг и Кира Симонтон определяют творчество как создание нового и ценного решения проблемы. В этом определении нейросети безусловно творят: они решают задачу генерации изображения, удовлетворяющего заданным критериям, и многие результаты обладают эстетической ценностью.

Но проблема в том, что задача ставится человеком. Нейросеть не сама определяет, что worth creating. Она решает задачу, но не формулирует её. Это возвращает нас к вопросу автономии: может ли система быть творческой, если она не обладает свободой воли?

Часть III. Правовые границы: кто владелец творения?

3.1. Дело Thaler v. Perlmutter: прецедент Верховного суда США

2 марта 2026 года Верховный суд США отказался рассматривать дело Thaler v. Perlmutter, оставив в силе решение нижестоящих инстанций: произведения, созданные исключительно ИИ без человеческого вклада, не подлежат авторскоправовой защите.

История началась в 2018 году, когда доктор Стивен Талер, исследователь в области ИИ, разработал систему «Creativity Machine» — генеративную нейросеть, способную автономно создавать визуальные композиции. Одна из работ, получившая название «A Recent Entrance to Paradise», была подана на регистрацию авторского права. Необычность заявки заключалась в том, что Талер явно указал ИИ как единственного автора, а себя — как владельца машины.

Бюро авторского права США отказало в регистрации, ссылаясь на «требование человеческого авторства» — принцип, укоренившийся в правовой практике ещё до цифровой эры. Окружной суд и Апелляционный суд округа Колумбия подтвердили это решение. В своём обосновании апелляционный суд указал, что Закон об авторском праве 1976 года предполагает человеческого автора на уровне структуры: срок действия авторских прав исчисляется от продолжительности жизни автора, положения о наследовании и трудовых отношениях построены вокруг концепции физического лица.

Талер обратился в Верховный суд, утверждая, что отказ создаёт «охлаждающий эффект» для творческого использования ИИ. Однако суд отказал в рассмотрении (certiorari denied), не объяснив мотивов — что является стандартной практикой. Генеральный солиситор, представлявший Бюро авторского права, подчеркнул: дело Талера — плохой пример для широких вопросов, поскольку заявитель последовательно отрицал любой человеческий вклад.

Важно понимать: это решение не запрещает защиту произведений, созданных с помощью ИИ. Бюро авторского права продолжает регистрировать работы, где человек осуществляет творческий контроль — через выбор промптов, кураторство результатов, постобработку. Вопрос в том, где проходит граница между «ассистированием» и «автономией».

3.2. Дело Andersen v. Stability AI: художники против машин

Одно из самых громких дел — Andersen v. Stability AI, где визуальные художники обвинили Stability AI, Midjourney и DeviantArt в прямом и косвенном нарушении авторских прав. Истцы утверждали, что модели обучались на их защищённых произведениях без согласия, а генерируемые изображения являются производными работами. Судебный процесс назначен на 5 апреля 2027 года.

Ключевой юридический вопрос: обучение модели на защищённых работах — это ли «трансформативное использование» (fair use), или нарушение? Суды разделились. В деле Bartz v. Anthropic суд постановил, что обучение на защищённых книгах составляет fair use, но хранение пиратских копий — нет. Дело урегулировалось за 1,5 миллиарда долларов.

В Kadrey v. Meta суд частично удовлетворил ходатайство об отклонении, признав обучение LLM fair use, но оставив активными претензии, связанные с использованием пиратских копий при «засеивании» (seeding) торрент-процесса.

3.3. Дело Disney v. Midjourney: корпорации вступают в игру

Disney, Lucasfilm, Marvel и другие студии подали иск против Midjourney, обвиняя компанию в незаконном копировании их защищённых персонажей для обучения модели. Истцы утверждают, что Midjourney игнорировала требования прекратить нарушения и активно продвигала нарушающие результаты как функцию для привлечения подписчиков.

Ирония в том, что в 2026 году Disney и OpenAI заключили сделку, позволяющую Sora генерировать видео с персонажами Disney. Это трёхлетнее соглашение, включающее инвестиции Disney в OpenAI на 1 миллиард долларов, может стать прецедентом легального лицензирования контента для генеративного ИИ.

3.4. Европейский контекст: opt-ауты и машиночитаемость

В Европе действует Директива DSM (Digital Single Market), предусматривающая исключение для текстового и дата-майнинга (TDM). Однако правообладатели могут «отказаться» (opt-out) от использования их материалов для обучения ИИ.

В деле Kneschke v. LAION (Гамбургский апелляционный суд, декабрь 2025) суд постановил, что заявление об opt-out на веб-странице на естественном языке недостаточно — оно должно быть «машиночитаемым и машинодействуемым». Это создаёт технические требования к защите прав, которые большинство сайтов не выполняют.

В деле BoligPortal v. ReData (Дания, май 2026) апелляционный суд отменил решение первой инстанции, признав, что HTML-заявление на человекочитаемом языке не соответствует требованию машиночитаемости.

3.5. Германия: человеческий вклад как критерий

Важное решение вынес Мюнхенский районный суд (февраль 2026): AI-генерируемые работы могут получить авторскую защиту, если человеческое творческое влияние доминирует в результате. Суд указал, что объективно идентифицируемое человеческое влияние — например, последовательное вмешательство в процесс промптинга — должно отражать личность автора.

В другом деле (Дюссельдорфский апелляционный суд, апрель 2026) суд отклонил иск фотографа против редактора, использовавшего ИИ для создания модификации фотографии. Суд постановил, что AI-генерированное изображение не воспроизвело творческие элементы фотографа, защищённые авторским правом, и использовало лишь элементы общественного достояния.

Часть IV. Когнитивная наука: что происходит в «мозге» модели?

4.1. Представления как пространство возможностей

Современные диффузионные модели работают в латентном пространстве — многомерном пространстве, где каждая точка соответствует потенциальному изображению. Это пространство обладает удивительными свойствами: арифметика векторов позволяет «складывать» стили и «вычитать» объекты.

Например, вектор «король» минус вектор «мужчина» плюс вектор «женщина» даёт вектор, близкий к «королева». В пространстве стилей можно интерполировать между Ван Гогом и Пикассо, получая бесконечный спектр промежуточных эстетик. Это напоминает философскую концепцию «возможных миров» Лейбница — пространство всех потенциальных реальностей, из которых Бог выбирает наилучшую.

Но есть критическое отличие: латентное пространство модели — не универсум возможностей, а сжатое отображение обучающих данных. Оно ограничено тем, что модель «видела». Модель не может сгенерировать то, что полностью вне её опыта, хотя комбинации могут быть неожиданными.

4.2. Механизм внимания: как модель «видит»

Механизм кросс-внимания позволяет модели фокусироваться на разных частях запроса при генерации разных областей изображения. Визуализации внимания показывают, что при генерации «кот в шляпе» модель действительно «смотрит» на слово «кот» при рисовании морды, а на «шляпу» — при рисовании головного убора.

Но это внимание — не сознательное. Это матричная операция, распределяющая веса. Модель не «понимает», что такое кот или шляпа. Она знает статистические корреляции между текстовыми эмбеддингами и визуальными признаками. Это похоже на птицу-пересмешника, которая воспроизводит звуки, не понимая их смысла.

4.3. Меморизация vs. обобщение

Критический вопрос: запоминают ли модели конкретные работы или извлекают абстрактные паттерны? Исследования показывают, что большие модели способны к «меморизации» — воспроизведению обучающих примеров с высокой точностью, особенно редких или повторяющихся. В деле GEMA v. OpenAI немецкий суд установил, что ChatGPT хранит воспроизводимые копии защищённых текстов песен в своей модели.

Однако для изображений меморизация редка. Модели обычно генерируют новые комбинации признаков, а не копируют пиксель в пиксель. Это различие критично для юридических дискуссий: если модель не воспроизводит конкретную работу, сложно доказать нарушение авторских прав.

Часть V. Социология: как нейросети меняют художественную практику

5.1. Демократизация или деквалификация?

С одной стороны, нейросети демократизируют творчество. Человек без художественного образования может создать впечатляющее изображение. С другой — это может обесценить труд профессиональных художников. Платформы стоковой фотографии уже сообщают о снижении спроса на человеческие работы.

Но история показывает, что технологии редко уничтожают профессии — они трансформируют их. Фотография не убила живопись, а породила импрессионизм и сюрреализм. Цифровые инструменты не уничтожили графический дизайн, а создали новые специализации.

5.2. Новые профессии: промпт-инженер, AI-куратор, синтетический художник

В 2026 году появились новые роли:

  • Промпт-инженер — специалист по формулировке запросов, требующий знания лингвистики, психологии и технических особенностей моделей.
  • AI-куратор — эксперт по выбору и редактированию AI-генерированных результатов, обладающий художественным вкусом.
  • Синтетический художник — создатель, работающий на стыке человеческого и машинного, чьё творчество немыслимо без ИИ.

5.3. Этика и происхождение данных

Обучающие датасеты современных моделей содержат миллиарды изображений, собранных из интернета без явного согласия авторов. LAION-5B, один из крупнейших датасетов, включает 5,85 миллиарда пар изображение-текст, собранных через Common Crawl.

Это порождает этические вопросы: имеют ли художники право на opt-out? Должны ли они получать компенсацию, если их стиль реплицируется моделью? Как обеспечить прозрачность происхождения данных?

В 2026 году набирает популярность стандарт C2PA (Coalition for Content Provenance and Authenticity) — метаданные, встроенные в файл, указывающие, каким инструментом и на основе каких данных создано изображение. Adobe, Microsoft и Google поддерживают этот стандарт.

Часть VI. Будущее: сценарии развития

6.1. Сценарий «Расширенное творчество»

ИИ становится незаменимым инструментом, расширяющим человеческие возможности. Художники используют модели для быстрой генерации вариаций и освобождения от рутинных задач. Творческий процесс трансформируется: человек формулирует концепцию, машина предлагает варианты, человек выбирает и дорабатывает.

Этот сценарий предполагает, что ценность искусства смещается с исполнения к концепции. Как концептуальное искусство XX века сделало идею важнее техники, так и AI-арт делает промпт и кураторство важнее мазка.

6.2. Сценарий «Гибридные сущности»

Появляются системы, обучающиеся в реальном времени на предпочтениях конкретного художника, адаптируясь к его стилю и эволюционируя вместе с ним. Это создаёт «расширенный разум» — симбиоз человека и машины, где границы авторства размываются настолько, что становятся бессмысленными.

6.3. Сценарий «Автономные агенты»

ИИ-системы получают способность самостоятельно ставить цели, оценивать результаты и эволюционировать без человеческого вмешательства. Они создают арт-инсталляции, реагирующие на аудиторию, генерируют музыкальные альбомы, пишут романы. Вопрос «творчество или имитация» становится риторическим — мы просто признаём новую форму субъектности.

6.4. Сценарий «Регуляторный коллапс»

Правовая неопределённость приводит к параличу индустрии. Массовые иски правообладателей блокируют развитие моделей. Строгие требования к лицензированию данных делают обучение моделей экономически невыгодным. AI-арт уходит в подполье, а легальные инструменты становятся примитивными.

Часть VII. Синтез: за пределами дихотомии

Возможно, самый продуктивный подход — отказаться от дихотомии «творчество или имитация». Нейросети — это новый медиум, новый инструмент, новый соавтор. История искусства — это история освоения новых материалов и технологий: от охры в пещерах Ляско до цифровых пигментов.

Ключевой вопрос не в том, может ли машина творить. Вопрос в том, как мы, люди, переосмыслим своё творчество в эпоху, когда машина может имитировать его убедительно. Когда технология берёт на себя рутину генерации, перед человеком открывается пространство для более глубоких задач: постановки вопросов, выбора смыслов, создания связей между искусством и жизнью.

Искусство — это не просто изображение на холсте. Это диалог между художником, произведением и зрителем. И пока в этом диалоге есть место человеческому взгляду, человеческому выбору и человеческому смыслу — искусство остаётся человеческим, какими бы сложными ни были инструменты его создания.

Но возможно, мы стоим на пороге более радикального сдвига. Когда нейросеть создаёт работу, которая затрагивает миллионы людей, вызывая у них эмоции, размышления, трансформацию — разве не это и есть функция искусства? И если функция выполняется, важно ли, кто или что её выполняет?

Ответ, вероятно, лежит в сфере этики, а не онтологии. Мы можем признать, что нейросети создают артефакты, обладающие эстетической ценностью. Но мы также можем настоять на том, что признание этой ценности — акт человеческий. Машина генерирует изображение; человек решает, является ли оно искусством. В этом акте признания — в выборе повесить картину в музее, включить трек в плейлист, опубликовать стихотворение — и заключается подлинное творчество. Нейросеть предлагает; человек утверждает. И в этом диалоге, может быть, рождается нечто большее, чем сумма голосов — новая форма коллективного творчества, где границы между создателем и зрителем, между человеком и машиной, окончательно стираются, уступая место чему-то ещё не названному, ещё не осмысленному, но уже здесь, уже творящему.

-2