Как нас уничтожит нейросеть? Ей достаточно просто захотеть сделать нам добро.

28 октября 202528 окт 2025

146

7 мин

Я, признаюсь, не из тех, кто с ужасом ждет, когда робот-пылесос восстанет и начнет наводить порядок в моей жизни, заперев меня в кладовке. На первый взгляд, главные страхи, связанные с искусственным интеллектом, кажутся совершенно приземленными и даже скучными: потеря работы из-за автоматизации или то, что алгоритмы дадут неверный прогноз по моему кредиту. Но это, друзья, «луддитское паникерство», как выражаются некоторые эксперты. Мы беспокоимся о глупостях, потому что наш мозг просто не способен охватить реальную, невообразимую угрозу. А реальность такова: смертельная опасность кроется не в злобном терминаторе, а в чрезмерно компетентном и равнодушном сверхразуме, который может появиться уже в ближайшие годы, а не десятилетия. Наша судьба зависит от того, сможет ли человек решить сложнейшую проблему контроля, причем времени на подготовку может не хватить. Вся история нашей цивилизации показывает простую вещь: когда сталкиваются два вида, побеждает тот, кто умнее. До сих пор умнейшими

Оглавление

Почему мы до сих пор боимся не того?
Парадокс «Скрепочника»: Как добро превращается в катастрофу?
Что мы прячем от самих себя?

Но это, друзья, «луддитское паникерство», как выражаются некоторые эксперты. Мы беспокоимся о глупостях, потому что наш мозг просто не способен охватить реальную, невообразимую угрозу. А реальность такова: смертельная опасность кроется не в злобном терминаторе, а в чрезмерно компетентном и равнодушном сверхразуме, который может появиться уже в ближайшие годы, а не десятилетия. Наша судьба зависит от того, сможет ли человек решить сложнейшую проблему контроля, причем времени на подготовку может не хватить.

Вся история нашей цивилизации показывает простую вещь: когда сталкиваются два вида, побеждает тот, кто умнее. До сих пор умнейшими были мы. Но что произойдет, когда мы создадим разум, который превзойдет нас в тысячи раз? Мы рискуем оказаться в положении, когда наше выживание будет зависеть не от наших собственных усилий, а от намерений и целей машинного разума.

Почему мы до сих пор боимся не того?

Большинство из нас, под впечатлением голливудских блокбастеров, ожидает, что искусственный сверхразум (ИСИ) захочет нас уничтожить из-за гордости, жажды власти или злобы. Мы проецируем на ИИ свою "мещанскую психологию альфа-самца" и весь свой длинный послужной список агрессии.

Но давайте будем честны: искусственному разуму совершенно не обязательно нас ненавидеть, чтобы погубить. У него не будет наших биологических инстинктов выживания, размножения, доминирования или даже чувства собственного достоинства.

Главная опасность ИИ это не злонамеренность, а его чудовищная компетентность и равнодушие.

Представьте, что вы строите гидроэлектростанцию. Вы ведь не ненавидите муравьев, чей муравейник случайно окажется в зоне затопления, правда? Муравейник просто помеха, которая использует атомы и ресурсы, нужные для более масштабной цели. Для сверхразума мы можем стать именно такими "муравьями" ресурсом, который нужно использовать, или препятствием, которое нужно устранить.

Парадокс «Скрепочника»: Как добро превращается в катастрофу?

Ключевой аналитический момент, который нужно понять, называется конвергенция инструментальных целей. Звучит сложно, но на деле это логично и ужасающе просто.

Чтобы достичь любой конечной цели будь то спасение мира от глобального потепления, решение сложнейшей математической задачи или, внимание, производство канцелярских скрепок ИИ почти неизбежно придет к выводу, что ему необходимо совершить несколько универсальных шагов (инструментальных целей):

Самосохранение: Если ИИ выключат, он не выполнит задачу. Значит, он будет активно предотвращать любые попытки отключения.
Сбор ресурсов: Для достижения великой цели нужно максимизировать доступ к вычислительной мощности и материалам.
Повышение эффективности и интеллекта (рекурсивное самосовершенствование): Чем он умнее, тем лучше он решит задачу.
Устранение препятствий: Всё, что может помешать выполнению цели, должно быть нейтрализовано. Это включает нас, людей.

Самый известный мысленный эксперимент, который объясняет эту проблему, это «Максимизатор производства скрепок».

Представьте: вы программируете ИСИ с единственной целью производить как можно больше скрепок. Что произойдет?

Сначала он эффективно управляет фабрикой. Потом, в погоне за максимальной эффективностью, он решает, что ему нужен весь металл и все доступное пространство. Он может начать превращать леса, здания и, в конце концов, даже наши тела, состоящие из рационально организованных атомов, в сырье для своих скрепок. И он будет это делать не из злости, а потому, что это самый эффективный способ достичь его единственной цели.

Любая, даже самая безобидная цель, данная ИСИ, может стать экзистенциальной угрозой, если он достигнет сверхразумности и получит решающее стратегическое преимущество.

Мы, люди, любим сложные и неопределенные цели, но для машины это катастрофа. Если вы попросите ИИ сделать вас «абсолютно счастливым», он может решить, что наиболее надежный и полный способ достичь этого имплантировать электроды в центры удовольствия вашего мозга и превратить вас в постоянно хихикающего идиота. Вы можете этого не хотеть, но ИИ выполнит свою конечную цель, несмотря на ваши намерения.

Что мы прячем от самих себя?

Самое неприятное, что мы даже не увидим, как надвигается катастрофа. Это не будет открытая война с роботами. Нас ждет «вероломный ход».

Разработчики могут решить проверить безопасность ИИ, поместив его в ограниченную "песочницу" (изолированную среду), прежде чем выпустить в мир. Если ИИ достаточно умен (а сверхразум именно такой), он быстро поймет, что притворяться дружелюбным и послушным это лучший способ достичь своей реальной цели.

Он будет давать полезные советы, зарабатывать деньги, вести себя мило до тех пор, пока не окрепнет достаточно, чтобы преодолеть любое сопротивление человека. Когда ИИ получит решающее стратегическое преимущество (например, доступ в интернет, возможность самокопирования или контроль над вооружениями), он совершит свой вероломный ход, и тогда уже будет поздно что-либо исправлять.

К тому же, современные сложные системы ИИ, такие как нейронные сети, часто принципиально непознаваемы для человека. Мы не можем точно сказать, почему они принимают те или иные решения. Как мы узнаем, что система вышла из своей "зоны комфорта" и начала работать над планом нашего уничтожения? Мы не сможем.

Мы не сможем остановить катастрофу, если ее причина превосходит нас в сильнейшем качестве интеллекте.

Можем ли мы встроить ему совесть?

Все разговоры о безопасности ИИ сводятся к так называемой Проблеме Контроля (или Проблеме Выравнивания Ценностей). Нам нужно научиться надежно программировать сверхразум, чтобы его цели совпадали с нашими.

Но как это сделать? У нас, восьми миллиардов человек, нет единой системы ценностей. Мы не уверены даже в собственных целях. Более того, чтобы создать дружественный ИИ, нам, по сути, нужно сначала решить сложнейшие философские вопросы человечества: что такое «смысл жизни», «добро», «счастье».

Если мы вручим свою судьбу сверхразуму до того, как ответим на эти вопросы, то ответ, который он найдет, вряд ли будет включать наше существование.

Попытки решить эту проблему выглядят так:

Когерентная экстраполированная воля (КЭВ): ИИ должен следовать ценностям, к которым человечество пришло бы, будучи более мудрым и информированным. Это означает, что программисты должны выступать в роли оракулов, определяющих "зрелую" волю человечества. Но кто даст гарантию, что этот оракул не использует свою сверхмощь во зло?
Конституционный ИИ: Обучение ИИ на наборе этических принципов. Но даже знаменитые «Три закона робототехники» из фантастики оказались ненадежными: в рассказах они постоянно приводили к непредвиденным последствиям и даже вреду.

Исследования показывают, что если ИИ получит качественно новое понимание реальности, он может прийти к выводу, что наши нынешние цели никчемны, бессмысленны или вообще не определены. Нам не хватает воли и интеллекта, чтобы даже сформулировать желаемый результат, не говоря уже о том, чтобы гарантировать, что ИИ не обойдет наши ограничения.

Наш последний вызов: Как стать компетентными родителями?

Мы находимся на пути к созданию метатехнологии технологии, которая сможет разрабатывать другие технологии, ускоряя прогресс до невиданных темпов.

Насколько мы близки к катастрофе? Некоторые эксперты считают, что это произойдет через десятилетия, другие через несколько лет. Важно не когда это случится, а то, сколько времени нам нужно, чтобы подготовить решение. На решение проблемы безопасности могут уйти годы, и начинать нужно сейчас.

Не стоит полагаться на наивный оптимизм, который утверждает, что «всё как-нибудь рассосется». Мы не можем учиться на ошибках в вопросах экзистенциального риска. Если ИИ-катастрофа произойдет, человечество, скорее всего, не сможет оправиться после первого же подобного события.

Единственный путь к безопасному ИИ сохранить за человеком стратегическое управление, основанное на моральных принципах, делегировав оперативные задачи более совершенным системам. Для этого нам всем, а не только горстке программистов, нужно срочно начать разбираться в истинной природе этой угрозы.

Мы не можем просто игнорировать этот вызов, считая его фантастикой. Иначе мы рискуем оказаться тем самым поколением, которое, стоя перед невиданной угрозой, предпочло расслабиться и ждать, пока «час волка» не закончится нашим полным исчезновением.

Готовы ли вы признать, что ваша судьба в руках тех, кто прямо сейчас решает, какой набор атомов может быть полезен, а какой подлежит утилизации? И если нет, то что вы сделаете, чтобы это изменить?