На днях я занимался придумыванием сценария для одного из мероприятий, и, поскольку, мне для этой работы надо было вспомнить много классической литературы и классической музыки, которе я просто физически не помню, я спрашивал у ИИ. В целом, это уже почти сложившаяся практика, когда ChatGPT или DeepSeek заменили собой Яндекс и Google, поскольку пользоваться ими удобнее, а результат выдается в куда более подходящем для конкретной задачи виде (однако, "факты", выданные ИИ все-таки рекомендую перепроверять). В процессе этой работы я задумался о том, что такое креативность, поскольку, ранее полагал, что именно это и отличает людей от больших языковых моделей: люди способны на креативность, а ИИ - нет.
По определению, креативность - это способность создавать что-то новое, оригинальное, ценное само по себе, будь то идеи, решения, произведения искусства или инновационные продукты. Однако, анализируя то, как ко мне лично приходят новые идеи я прискорбием обнаружил, что мои новые идеи в подавляющем большинстве являются компиляцией прошлого опыта. Т.е., анализируя каждую новую идею, я практически всегда могу с достаточной уверенностью сказать на базе чего она построена. Известная истина про возможность видеть дальше, стоя на плечах гигантов, здесь, по крайней мере в моем случае, в полной мере подтверждается.
Уже достаточно давно я рассуждал о нашем понимании - о том, что мы можем понимать явления только если они раскладываются на имеющиеся у нас шаблоны, и мы совсем не способны понять то, что не имеет какого-либо отражения в нашем прошлом опыте. Наличие пересекающегося опыта - обязательное условие для построения диалога, поскольку диалог предполагает одинаковое понимание, а отсутствие пересекающихся шаблонов не позволит его сформировать. Эта проблема прекрасно описана в замечательной книге "Солярис": человек и разумный Океан никак не могли понять друг друга, и все попытки контакта завершались трагично для человека (возможно, и для Океана, но повествование ведется от лица человека, поэтому что чувствовал Океан мы не знаем, да и не способны понять, ибо наш диалог невозможен, так как у нас нет ничего общего).
На заре своего увлечения машинным обучением я писал о том, что искусство должно порождать чувство и поэтому не может быть создано бесчувственным автором. Сейчас, закончив специализацию, прекрасно понимая как работает большая языковая модель, что она даже не "понимает" что пишет, а лишь предсказывает наиболее вероятные слова, с минимальной функцией ошибки, я нередко удивляюсь результату. Само это понимание работы ИИ и того, к какому замечательному результату приводит эта, казалось бы, простая компиляция прошлого опыта, еще больше утвердило во мне уверенность, что наша, "человеческая" креативность и креативность "машинная" по природе очень похожи.
Чтобы лучше понять сложный вопрос, надо его разложить на элементы и каждый рассмотреть отдельно. К характеристикам креативности обычно относят оригинальность, гибкость, продуктивность и адаптивность. Оригинальность - умение мыслить нестандартно, выходить за рамки общепринятых шаблонов. Я под общепринятыми шаблонами понимаю такие, которые есть у подавляющего большинства. Выше я утверждал, что для понимания чего-либо нам нужны шаблоны, иначе никак. Значит, для обеспечения оригинальности нужно чтобы в моем арсенале были шаблоны, которые отсутствуют у большинства, но, вместе с тем, большинство сохранило способнсть оценить мою оригинальность. История неоднократно доказывала, что сильное опережение своего времени (~ чрезмерная оригинальность) не добавляет счастья. Но, в любом случае, широкий спектр шаблонов (оно же - способность многое понимать) - это однозначно функция знаний и жизненного опыта.
Гибкость – способность видеть проблему с разных сторон и находить неочевидные решения. Опять же неочевидные - для большинства, но для нас понятные, раз уж мы с вами до этого догадались. Здесь возможность видеть проблему с разных сторон - это однозначно компиляция прошлого опыта: память о там, как имели возможность оказаться в абсолютно разных ситуациях, и теперь это знание помогает нам точно их идентифицировать (или их аналогии) и лучше понимать поведение участников, и, в конечном счете, прогнозировать развитие текущей ситуации, предсказывать будущее, если хотите.
Продуктивность - генерация множества идей. Человек не может мыслить случайно, я с этого и начал. Если мы все задумаемся, мы вполне можем проследить ход своих мыслей - в конечном счете мы также выйдем на какую-то жизненную ситуацию в прошлом. Поэтому продуктивность - тоже функция жизненного опыта: чем больше у нас опыта, тем больше разных идей мы способны нагенерить.
Адаптивность - применение творческого подхода в разных сферах жизни. Обобщение - это ровно то, что мы делаем постоянно: чтобы что-то понять мы раскладываем это на имеющиеся у нас шаблоны, и чем больше шаблонов у нас есть (~ чем больше знаний и опыта) тем менее искаженно мы будем понимать мир, тем более удачные аналогии и параллели мы будем замечать.
Сейчас, когда мы более-менее разобрались с креативностью, пришло время ответа на основной вопрос: способны ли нейросети создавать креативные идеи? Исходя из того, что, как не крути, но наша креативность - это функция знаний и опыта, получается, что ИИ вполне мог бы с этим справляться, ибо по объему знаний человеку сложно сравниться с современными большими языковыми моделями. Технически нейросеть прекрасно может комбинировать идеи: ИИ анализирует огромные объемы данных (тексты, изображения, музыку) и комбинирует существующие концепции в новые сочетания, например, может предложить необычный сюжет для текста или видео, смешивая известные сюжеты и даже жанры. А мы, разве, так же не делаем? Да вся эта статья ровно про это: новые идеи - это комбинация прошлых, причем недалеко от них ушедшая, ибо что-то супер-революционное рискует быть не понято, не оценено (или быть неоцениваемым по причине отсутствия нужных шаблонов у большинства), поэтому в креативности тоже важна эволюционность, не революционность. Мы нередко угадываем влияние одного автора на другого, в музыке угадываем целые фрагменты, но несмотря на то, что эти новые произведения - компиляция прошлого, они имеют собственную ценность.
Так много я уже написал о том, что наша креативность очень похожа на машинную, но есть тонкие моменты, о которых также важно упомянуть. Креативность ИИ зависит от данных, т.е. для ИИ не применимо понятие "озарение". Это, возможно, слабый аргумент, так как "озарение" в моем понимании тоже, скорее, компиляция опыта, будь то упавшее Ньютону яблоко или привидевшаяся во сне Таблица Менделеева - и Исаак Исаакович и Дмитрий Иванович достаточное временя занимались проблемой, нагенерив кучу релевантных шаблонов, компиляция которых привела к соответствующим открытиям - количество перешло в качество (я и по себе не раз наблюдал, когда что-то не получается, но методичные и упорные тренировки, инвестирование времени и ресурсов, в конечном счете приводят к результату - кто занимался спортом, меня поймет, но этот принцип работает везде!). А вот отсутствие эмоций и опыта личных переживаний - это как раз та самая разница, которая в искусстве является ключевой. Все-таки искусство передает эмоцию автора, что невозможно в случае ИИ. Наверно, комбинируя описания различных эмоций, ИИ может создать новое, что нас заденет не меньше, но пока не берусь описывать эффективность этого: надо походить на выставки продуктов ИИ, оценить, а пока у меня нет достаточного опыта, но то, что я видел, было очень даже неплохо. А с учетом того, что наблюдается какой-то нехороший тренд по упрощению, не исключаю, что ИИ когда-нибудь обойдет мастеров искусств, не использующих ИИ вообще.
Данное исследование не было бы полным, если бы, помимо колоссальных знаний, я бы не обозначил еще одно преимущество ИИ перед человеком. Уже выше я упоминал, что человек не может генерировать абсолютно случайные идеи. Связанное с этим преимущество ИИ - возможность генерации неочевидных решений. ИИ не связан какими-то человеческими стереотипами, ИИ совсем не нужно, чтобы результирующая идея вкладывалась в какие-то шаблоны (т.е. была понимаема для самого автора), ибо Модель и не "понимает" что она нагенерила в ответ - в ряде случаев эта, казалось бы, проблема оборачивается преимуществом. Например, в рамках мозгового штурма, что является прекрасным инструментом для создания креативных идей, когда нам надо накидать материал и которого потом можно скомпилировать то, что подойдет под наши критерии успеха.
В заключении хочу сказать, что, как мы видим, креативность наша и машинная во многом похожи, но человек и машина имеют преимущества и недостатки, причем преимущества оного отражаются в недостатках другого. Поэтому нейросети могут быть мощными инструментами для креатива, помогая человеку. Однако, уверен, что действительно прорывные идеи возможны только в результате симбиоза ИИ и человека, т.е. как результат труда человека, усиленного ИИ в качестве инструмента.