Google DeepMind сумела запустить когнитивную эволюцию роботов

482 прочитали

Это может открыть путь к гибридному обществу людей и андроидов

Картина GPT-4 по мотивам работы Пьера Огюста Ренуара “Завтрак гребцов” . Действие происходит в гибридном обществе людей и андроидов.
Картина GPT-4 по мотивам работы Пьера Огюста Ренуара “Завтрак гребцов” . Действие происходит в гибридном обществе людей и андроидов.

1я ноябрьская ИИ-революция (Революция ChatGPT, начавшаяся в ноябре 2022) ознаменовала появление на планете нового носителя высшего интеллекта — цифрового ИИ, способного достичь (и, возможно, превзойти) людей в любых видах интеллектуальной деятельности.

Но не смотря на сравнимый с людьми уровень, этот новый носитель высшего интеллекта оказался абсолютно нечеловекоподобным.

Он принадлежит к классу генеративного ИИ больших языковых моделей, не умеющих (и в принципе не способных) не то что мечтать об электроовцах, но и просто мыслить и познавать мир, как это делают люди. И потому, даже превзойдя по уровню людей, он так и останется для человечества «чужим»  — иным типом интеллекта, столь же непостижимым для понимания, как интеллект квинтян из романа Станислава Лема «Фиаско» (см. мой пост).

Причина нечеловекоподобия генеративных ИИ больших языковых моделей заключается в их кардинально иной природе.
✔️ Наш интеллект — результат миллионов лет когнитивной эволюции биологических интеллектуальных агентов, позволившей людям из животных превратиться в сверхразумные существа, построивших на Земле цивилизацию планетарного уровня, начавшую освоение космоса.
✔️ ИИ больших языковых моделей – продукт машинного обучения компьютерных программ на колоссальных объемах цифровых данных.

Преодолеть это принципиальное отличие можно, если найти ключ к запуску когнитивной эволюции ИИ.

И этот ключ предложен 28го ноября 2023 инициаторами 2й ноябрьской ИИ-революции (Революции когнитивной эволюции ИИ) в опубликованном журналом Nature исследовании Google DeepMind «Learning few-shot imitation as cultural transmission».

  • Движком когнитивной эволюции ИИ авторы предлагают сделать (как и у людей) социальное обучение — когда один интеллектуальный агент (человек, животное или ИИ) приобретает навыки и знания у другого путем копирования (жизненно важного для процесса развития интеллектуальных агентов).
  • Ища вдохновение в социальном обучении людей, исследователи стремились найти способ, позволяющий агентам ИИ учиться у других агентов ИИ и у людей с эффективностью, сравнимой с человеческим социальным обучением.
  • Команде исследователей удалось использовать обучение с подкреплением для обучения агента ИИ, способного идентифицировать новых для себя экспертов (среди других агентов ИИ и людей), имитировать их поведение и запоминать полученные знания в течение всего нескольких минут.
”Наши агенты успешно имитируют человека в реальном времени в новых контекстах, не используя никаких предварительно собранных людьми данных. Мы определили удивительно простой набор ингредиентов, достаточный для культурной передачи, и разработали эволюционную методологию для ее систематической оценки. Это открывает путь к тому, чтобы культурная эволюция играла алгоритмическую роль в развитии искусственного общего интеллекта”, — говорится в исследовании.

Запуск когнитивной эволюции ИИ позволит не только создать «человекоподобный ИИ» у роботов — андроидов, но и разрешить при их создании Парадокс Моравека (высококогнитивные процессы требуют относительно мало вычислений, а низкоуровневые сенсомоторные операции требуют огромных вычислительных ресурсов) и Сверхзадачу Минского (произвести обратную разработку навыков, получаемых в процессе передачи неявных знаний — невербализованных и, часто, бессознательных).

Т.о. не будет большим преувеличением сказать, что 2я ноябрьская революция ИИ открывает путь к гибридному обществу людей и андроидов, —

многократно описанному в фантастических романах, но до сих пор остававшемуся практически нереализуемым на ближнем временном горизонте.

А теперь рассмотрим подробней вопросы когнитивной эволюции интеллектуальных агентов и революционного подхода к ее запуску, предложенного Google DeepMind.

Это может открыть путь к гибридному обществу людей и андроидов 1я ноябрьская ИИ-революция (Революция ChatGPT, начавшаяся в ноябре 2022) ознаменовала появление на планете нового носителя высшего...-2

Два разных типа интеллекта

Картина GPT-4 по мотивам работы Пьера Огюста Ренуара “Танец в Буживале”. Действие происходит в гибридном обществе людей и андроидов.
Картина GPT-4 по мотивам работы Пьера Огюста Ренуара “Танец в Буживале”. Действие происходит в гибридном обществе людей и андроидов.

Kак уже было отмечено, причина нечеловекоподобия генеративных ИИ больших языковых моделей заключается в их кардинально иной природе: наш интеллект — продукт когнитивной эволюции интеллектуальных агентов, а ИИ больших языковых моделей — продукт машинного обучения компьютерных программ на колоссальных объемах цифровых данных.

И хотя «аппаратные основы» этих двух типов интеллекта во многом похожи (не физически, а с точки зрения организации вычислений — нейросети), у современных генеративных ИИ больших языковых моделей в принципе отсутствуют две ключевые способности, формирующие наш биологический разум: социальное обучение и социально познание (процедуры совместного поиска информации, совместной добыча знаний и совместного нахождения эвристик).

Совокупность этих двух способностей нашего разума превратила людей в носителей воплощенного эусоциального коллективного интеллекта.

К сожалению, многие исследователи и по сей день полагают, что ключевыми особенностями интеллекта человека являются его биологическая основа и пройденный эволюционный путь, создавший за миллионы лет физическую основу интеллекта: его HW — мозг и SW –нейрохимическую прошивку.

Мне видится иначе. И биологическая основа, и пройденный эволюционный путь — лишь следствие океана случайностей в ходе миллионов лет экспериментов «слепого перелицовщика» — эволюции. В итоге, случилось так. А могло быть и совсем иначе.

  • Био-основа, да и сама жизнь, — конечно, великое открытие эволюции. Но нет принципиальных препятствий для реализации интеллекта на любой иной основе, позволяющей осуществлять обработку информации. Что уже доказано на практике изобретением кремниевых компьютеров — HWной и SWной основы любого современного ИИ.
  • Пройденный эволюционный путь, конечно же, уникален. Будь он иным, наши HW и SW интеллекта были бы иными. Однако, разве можно признать, что итоговые HW и SW интеллекта человека — это некий универсальный оптимум, некий эталон для всех возможных интеллектов?
Наш интеллект — всего лишь предсказательный механизм, приспособленный «слепым перелицовщиком» для оптимального решения задачи выживания и воспроизводства людей в конкретных условиях окружающего его мира. Будь эти условия иными, — интеллект должен был также стать иным.

Но есть ли тогда у нашего интеллекта какие-то ключевые особенности?

Полагаю, что есть:

✔️ Воплощенность — наличие у когнитивного агента тела и органов чувств.

✔️ Эусоциальность — высшая форма социальности, при которой представители вида живут группами, состоящими из нескольких поколений, и члены группы действуют альтруистично по отношению друг к другу в соответствии с регулярным разделением труда.

✔️ Коллективность — интеллект этого типа, помимо механизма генетического наследования информации, располагает вторым негенетическим механизмом (культурой) и может развиваться исключительно в ходе социального обучения — процесса, превращающего биологическую (генную) эволюцию в генно-культурную коэволюцию, увеличивая тем самым объемы передаваемой между поколениями информации на много порядков.

Только находясь в коллективе, пребывая в постоянном процессе социального обучения и специализации, человек обретает свойственный ему тип интеллекта, впитывая в себя огромный объем культурной информации (в ходе социального познания), намного превосходящей информацию, передаваемую генетическим путем (подробней, см. мой пост)

Все три названные ключевые особенности людей, как интеллектуальных агентов, отсутствуют у генеративного ИИ больших языковых моделей. Что исключает для них возможность когнитивной эволюции, без которой не мог бы сформироваться интеллект людей. А это, в свою очередь, становится непреодолимой преградой на пути к человекоподобному ИИ.

Когнитивная эволюция человека

Мерлин Уилфред Дональд — психолог, нейроантрополог, когнитивный нейробиолог и теоретик культуры, почетный профессор психологии Королевского университета Онтарио. Справа — одна из его наиболее влиятельных монографий Origins of the Modern Mind: Three stages in the evolution of culture and cognition (полуторочасовой видеорассказ автора об этой книге см. здесь https://www.youtube.com/watch?v=cCCjqQocsMA)
Мерлин Уилфред Дональд — психолог, нейроантрополог, когнитивный нейробиолог и теоретик культуры, почетный профессор психологии Королевского университета Онтарио. Справа — одна из его наиболее влиятельных монографий Origins of the Modern Mind: Three stages in the evolution of culture and cognition (полуторочасовой видеорассказ автора об этой книге см. здесь https://www.youtube.com/watch?v=cCCjqQocsMA)

Согласно теории когнитивной эволюции человека, разработанной Мерлином Дональдом):

«Люди — это когнитивные гибриды, привязанные как к биологии, так и к культурной среде. Другими словами, люди были первым видом, у которого развилась действительно «распределенная» когнитивная система, то есть система, в которой мышление и память осуществляются в сообществе разумов. В сети люди присоединяются к более крупной когнитивной архитектуре, которая может обладать способностями (например, глубокими ресурсами памяти и разнообразным опытом), недоступными отдельным людям. Сети также могут служить генераторами новых и мощных когнитивных инструментов (например, языков, инструментов и символических обозначений). Языки, в частности, представляют собой явления сетевого уровня».

Центральный тезис теории когнитивной эволюции человека заключается в том, что

в ходе эволюции людей природа выработала совершенно новую когнитивную стратегию: симбиоз мозга и культуры.

✔️ Как следствие, человеческий мозг не может реализовать свой проектный потенциал, если он, в процессе своего развития, не погружен в распределенную коммуникационную сеть, — то есть в культуру.

✔️ Человеческий мозг в буквальном смысле специально приспособлен для функционирования в сложной символической культуре

Более подробное описание этой междисциплинарной теории, основанной на синтезе знаний палеонтологии, лингвистики, антропологии, когнитивной науки и нейропсихологии, мотивированный читатель может найти в моем лонгриде “Алгокогнитивная культура”. Наиболее же полное описание можно прочесть в монографии Мерлина Дональда «Origins of the Modern Mind: Three stages in the evolution of culture and cognition».

20-ти минутное изложение теории когнитивной эволюции человека автором

Здесь же мы для краткости лишь перефразируем некоторые из основных положений этой теории применительно к рассматриваемой в данном посте теме.

  1. Уникальность человеческого разума в том, что эволюция снабдила нас «когнитивными гаджетами» для подключения к распределенным когнитивным сетям (distributed cognitive networks) себе подобных. Подключаясь к этим сетям, мы становимся способными к социальному обучению и социальному познанию. Без этих 2х факторов интеллектуального развития наш разум мало чем отличался бы от разума животного или ребенка-маугли.
  2. Ключевая проблема социального обучения (когда один человек приобретает навыки и знания у другого путем копирования) и социального познания (являющегося результатом социального обучения) — как передавать другому свои мысли и как понимать мысли других. Проблема здесь в том, что почти все содержимое нашего мозга — продукт его творчества. Мозг обладает минимумом знаний об окружающем мире, предпочитая домысливать остальное на основе предыдущего опыта (подробней в моем лонгриде “Конституция биоматематики”). Следовательно, нужен специальный интерфейс, способный передавать уникальные мысли между уникальными разумами.
  3. Этот интерфейс зависит от принципа работы доступных человеку «когнитивных гаджетов» (подробней в моем лонгриде “Превращение в инфоргов”). Примерно 100 тыс. лет назад у людей заработал «когнитивный гаджет» символической коммуникации. Членораздельная речь людей развилась до уровня полностью символического, синтаксически развитого языка, позволяющего в ходе социального обучения передавать огромные объемы произвольной информации, как между индивидами, так и между поколениями. Появилась возможность передавать сложные абстрактные идеи и понятия не только о том, что происходит здесь и сейчас, но и о других временах и местах — даже воображаемых.
  4. Но к моменту формирования у людей «когнитивного гаджета» символической коммуникации, у представителей рода Homo уже пару миллионов (!) лет социальное обучение и социальное познание были важнейшими факторами интеллектуального развития их разума. И реализовывались оба эти фактора протосимволическим «когнитивным гаджетом», работающим на миметичском принципе (от греческого слова “мимесис”, означающего подобие, воспроизведение, подражание). Т.е. коммуникация в когнитивных сетях велась на языке тела, жестов и подражания. Без этого протосимволического «когнитивного гаджета подражания» в когнитивных сетях дальних прародителей Homo sapiens не были бы изобретены метательное оружие и составные инструменты, и не были бы освоены систематическое использование огня и сложностратегическая коллективная охота на крупную дичь.

Фрагмент лекции Мерлина Дональда, где он говорит о мимесисе — как о ключевом факторе когнитивной эволюции людей

Люди — чемпионы по подражанию. Ни одно другое животное не делает это столь искусно. Ближайшие родственники людей — шимпанзе и даже некоторые птицы способны копировать поведение друг друга, особенно, когда видят, что такое поведение приводит к полезному результату. Но в протосимволической культуре доязыковых обществ древних Homo «когнитивный гаджет подражания» играл центральную — ключевую роль в социальном научении и передаче знаний, воплощаясь в форме разнообразных ритуалов (см. мой лонгрид “Великая тайна ритуалов”).

Благодаря символическому воспроизведению коллективных нарративов, ритуал функционировал как воплощенный праязык. Он обеспечивал «внешнюю систему поддержки» индивидуального познания — решающий шаг на пути к языку как таковому. Мерлин Дональд писал в этой связи, что «ритуал был ментальным краеугольным камнем эволюции социального познания, позволяя ранним гоминидам согласовывать свой разум с социальными условностями».

Можно без преувеличения сказать, что протосимволический «когнитивный гаджет подражания» сыграл ключевую роль в нашей эволюции после того, как прародители людей эволюционно разошлись с шимпанзе 6–7 миллионов лет назад.

Он был ключевым механизмом социального обучения и, в целом, формирования социальных актов и самих человеческих сообществ. Без него не возникло бы общество и не появился бы уникально развитый человеческий язык.

Культурная передача и социальное обучение через подражание

Картина GPT-4 по мотивам работы Пьера Огюста Ренуара “Девушки за фортепьяно”. Действие происходит в гибридном обществе людей и андроидов.
Картина GPT-4 по мотивам работы Пьера Огюста Ренуара “Девушки за фортепьяно”. Действие происходит в гибридном обществе людей и андроидов.

Kультурная передача — это общий социальный навык, который позволяет агентам получать и использовать информацию друг от друга в режиме реального времени с высокой точностью и запоминаемостью. Его можно рассматривать как процесс, который увековечивает подходящие варианты культурной эволюции. У людей культурная эволюция привела к накоплению и совершенствованию навыков, инструментов и знаний на протяжении поколений.

Согласно разработанной Мерлином Дональдом теории когнитивной эволюции, человеческий интеллект несколько более развит, чем у наших родственников-обезьян, но мы не должны преувеличивать размер когнитивного разрыва.

Коллективно мы можем быть очень умными и способны достигать замечательных результатов. Но по отдельности, и особенно в изоляции от общества, мы довольно ограниченные существа.

Это относится даже к нашим т.н. гениям, большинство из которых в большей степени являются продуктом своей исторической ситуации, чем им хотелось бы признать.

Под символическими и лингвистическими навыками людей скрывается более глубокий уровень представлений, также существующий исключительно у Homo.

Т.е. в основе когнитивной эволюции людей существуют три уровня специальных навыков :
1. Протолингвичтический уровень, предшествовавший появлению речи у людей, позволивший первый фундаментальный прорыв от психической архитектуры обезьян к психической архитектуре людей.
2. Уровень устного языка и культуры
3. Уровень символов и визуальных кодов.

Первый революционный скачок в процессе когнитивной эволюции Homo произошел у Homo erectus (вида гоминидов, появившихся на Земле примерно 1,5 млн. лет назад) задолго до возникновения у них беглой речи.

Согласно теории когнитивной эволюции, разум этих видов обладал тем, что заложило основу радикально новой формы познания и первым истинно человеческим уровнем представления памяти — умение подражать. Этот тип культуры Мерлин Дональд называет «подражательной» культурой.

По сути, «подражательная» культура есть ни что иное, как гипотетическое пропущенное звено — возможная форма оригинальной, архаической, довербальной культуры интеллектуальных агентов. Уникальное революционное усовершенствование мозга обезьяны, сделавшее возможным «подражательную» форму культуры, в последствии сделало возможным возникновение разнообразных культур групповой ритуальной деятельности, координации индивидов и групп в рамках сообществ и т.д.

На протяжении когнитивной эволюции людей формы культуры (и, соответственно, культурной передачи и когнитивных гаджетов) многократно менялись. Однако, и у современных людей мышление подобно стеганному одеялу, состоящему из лоскутков эволюционных новшеств. Даже в 21 веке все культуры человечества несут в себе мощную подражательную составляющую: большинство эмоциональных коммуникаций и социальных сделок подражательны; также, подражательно и групповое поведение, вкл. театр и публичные ритуалы (подробней см. здесь).

Т.о. социальное обучение и культурная передача с помощью «когнитивного гаджета подражания», формировавшие психическую архитектуру людей на протяжении многих сотен тысяч лет, было и остается важнейшим фактором, движущим когнитивную эволюцию людей.

Что конкретно сделали в Google DeepMind

GoalCycle3D. Трехмерная физическая симуляция пространства задач. Каждая задача содержит процедурно сгенерированный ландшафт, препятствия и сферы целей, параметры которых выбираются случайным образом при создании задачи. Каждый агент получает независимое вознаграждение за посещение целей в определенном циклическом порядке, также выбранном случайным образом при создании задачи. Агенту не предоставляется правильный порядок, поэтому агент должен определить порядок вознаграждения либо экспериментально, либо с помощью культурной передачи от эксперта. Наше пространство задач представляет собой навигационные задачи неограниченной сложности, параметризованные размером моделируемого мира, плотностью препятствий, неровностями местности и количеством целей. Интеллектуальный агент наблюдает за миром с помощью лидара (как это происходит, показано на 31 видеоролике в приложении к статье).
GoalCycle3D. Трехмерная физическая симуляция пространства задач. Каждая задача содержит процедурно сгенерированный ландшафт, препятствия и сферы целей, параметры которых выбираются случайным образом при создании задачи. Каждый агент получает независимое вознаграждение за посещение целей в определенном циклическом порядке, также выбранном случайным образом при создании задачи. Агенту не предоставляется правильный порядок, поэтому агент должен определить порядок вознаграждения либо экспериментально, либо с помощью культурной передачи от эксперта. Наше пространство задач представляет собой навигационные задачи неограниченной сложности, параметризованные размером моделируемого мира, плотностью препятствий, неровностями местности и количеством целей. Интеллектуальный агент наблюдает за миром с помощью лидара (как это происходит, показано на 31 видеоролике в приложении к статье).

Исследователи стремились показать, как агенты ИИ могут учиться у других интеллектуальных агентов с эффективностью, сравнимой с человеческой. В физическом моделируемом пространстве задач под названием GoalCycle3D (см. рисунок)— своего рода компьютерно-анимированной игровой площадке с пешеходными дорожками и препятствиями — авторы обнаружили, что агенты ИИ могут учиться у людей и ИИ-экспертов решению ряда навигационных задач, даже если они никогда их не видели, и даже, не имея каких-либо представлений, что это такое.

Исследователи Google DeepMind предложили метод создания культурной передачи в агентах ИИ в форме подражания (имитации) с малым числом примеров (имеется в виду “обучение подражанием при малом количестве данных” — few-shot imitation).

В экспериментах исследования:

✔️ ИИ агентам удается в режиме реального времени имитировать человека в новых контекстах без использования каких-либо предварительно собранных людьми данных.
✔️ ️Авторы определили удивительно простой набор ингредиентов, достаточный для создания культурной передачи, и разработали методологию для ее систематической оценки.
Это открывает путь культурной эволюции ИИ, которая может сыграть алгоритмическую роль в развитии общего искусственного интеллекта (AGI).

Двумя отличительными особенностями социального обучения ИИ-агентов методом подражания (имитации) с малым числом примеров, являются:

✔️ отсутствие необходимости больших наборов обучающих данных;

✔️ огромная скорость обучения (см. рис. ниже)

Это может открыть путь к гибридному обществу людей и андроидов 1я ноябрьская ИИ-революция (Революция ChatGPT, начавшаяся в ноябре 2022) ознаменовала появление на планете нового носителя высшего...-7

Метрика культурной передачи обучения показывает на этом рисунке четыре отдельные фазы в ходе обучения, каждая из которых соответствует отдельному поведению агента в области социального обучения. На этапе 1 (красный) агент начинает знакомиться с задачей, изучает представления, передвижение и исследование без значительного улучшения результатов. На этапе 2 (синий), обладая достаточным опытом и представлениями, сформированными потерей внимания, агент осваивает свой первый навык социального обучения, следуя за ботом-экспертом для решения задачи. Показатель передачи культуры обучения увеличивается до 0,75, что предполагает чистое следование.

Столь быстрое обучение на минимуме данных решает большинство проблем, связанных с Парадоксом Моравека (высококогнитивные процессы требуют относительно мало вычислений, а низкоуровневые сенсомоторные операции требуют огромных вычислительных ресурсов) и Сверхзадачей Минского (произвести обратную разработку навыков, получаемых в процессе передачи неявных знаний (невербализованных и, часто, бессознательных).

-- -- --

В заключение поста еще раз вернусь к главным выводам, упомянутым в его вступлении.

Не будет большим преувеличением сказать, что 2я ноябрьская революция ИИ (Революции когнитивной эволюции ИИ) может открыть путь:

▶️ к запуску эволюции когнитивных способностей ИИ-агентов на основе социального обучения путем мимесиса;

▶️ к созданию на основе таких ИИ-агентов роботов-андроидов, человекоподобных не только внешне, но и по психической архитектуре разума;

▶️ а в перспективе, — и к гибридному обществу людей и андроидов, многократно описанному в фантастических романах, но до сих пор остававшемуся практически нереализуемым на ближнем временном горизонте.

#ИИ #Интеллект #Разум #Эволюция #Культура #Алгокогнитивная Культура #Роботы

Это может открыть путь к гибридному обществу людей и андроидов 1я ноябрьская ИИ-революция (Революция ChatGPT, начавшаяся в ноябре 2022) ознаменовала появление на планете нового носителя высшего...-8

Ваши шансы увидеть мои новые посты быстро уменьшатся до нуля, если вы не лайкаете, не комментируете и не делитесь в соцсетях