Найти тему

Универсальный разум - проект AGI For All (AGIFA), часть 2

GitHub - LiveBaster/agifa: "Artificial General Intelligence For All (AGIFA)" Project

Цель проекта - разработать универсальный интеллектуальный движок,
способный к самообучению, развитию и решению задач разного типа.
Движок один - задачи разные.
Далее, я буду рассказывать о Базовом Компоненте Разума (БКР), в части
выбора требуемого результата и поиска способа его достижения, а также
немного про саморегуляцию.

Определение универсального разума (AGI)
По «объединённому и расширенному определению» от Ben Goertzel, Pei
Wang, Shane Legg, Marcus Hutter — способность достигать сложных целей в
различных сложных средах, в условиях ограниченных ресурсов,
минимизируя риски, в том числе, обучаясь поведению в новых средах как с
учителем, так и без него.
https://golos.id/ru--tekhnologii/@aigents/opredeleniya-ii?invite=aigents
Колонин Антон

Что требуется сделать, по определению?
● способность достигать сложных целей в сложных средах
● возможность минимизировать риски и расход ресурсов
● обучение с учителем или без него
Самое непонятное здесь - что понимать под “сложностью”?
Интуитивно понятно, что если мало компонентов, из которых создаётся универсальный разум, то это “простая система”. Например, управлять одним квадрокоптером - это достаточно просто.
Если компонентов много, то это “сложная система”. Например, управлять 10000 квадрокоптеров - это много сложнее, чем одним.
Гипотеза: сложная система сможет достигать сложных целей в сложных средах.
Каким требованиям должны удовлетворять компоненты, чтобы из них была возможность построить сложную систему?

Требования к компонентам универсального разума
1.
взаимосодействие параллельных компонентов для достижения
общего требуемого результата
2.
выбор требуемого результата и поиск способа его достижения
3.
саморегуляция
4.
подражание
Гипотеза: Без реализации этих 4-х свойств, создать универсальный разум не
получится.
Каждый Базовый Компонент Разума (БКР) должен обладать всеми 4-мя
свойствами.

Соответствие требований БКР целям из определения
1.
взаимосодействие параллельных компонентов для достижения общего
требуемого результата - требуется для создания сложной системы
2.
выбор требуемого результата и поиск способа его достижения -
требуется для достижения целей
3.
саморегуляция - требуется для минимизации рисков и расхода ресурсов
4.
подражание - требуется для обучения с учителем или без него
Далее, я буду детализировать пункт 2:
выбор требуемого результата и поиск
способа его достижения, и пункт 3
саморегуляция.

Дерево Результатов (ДР), правила построения
1. ДР — это дерево, каждый узел которого состоит из Результата (название результата и параметры результата).
2. Каждый Результат может состоять из одного и более дочерних Результатов.
3. Каждый Результат имеет параметры «Дату-время начала» и «Длительность», т. е. узел ДР — это процесс во времени, по окончании выполнения которого получается требуемый результат.
4. Нельзя получить Родительский Результат, без достижения всех дочерних результатов.
5. Если название одного Результата совпадает с другим Результатом, то это считается одним и тем же результатом, т. е. один узел ДР может иметь более одного родительского узла.
6. Формулировка названия Результата должна отвечать на вопрос «Что?». Например, «Что требуется сделать?» - «Построить дом».
7. Дочерние результаты получаются посредством рекурсивного ответа на вопрос: «Что требуется сделать для достижения текущего Результата?».

Дерево Результатов (ДР), пример
Дерево Результатов (ДР), пример

Дерево Результатов (ДР), основные свойства
1. Узлы ДР проще сравнивать друг с другом, потому что все их дочерние
элементы имеют строгие зависимости друг от друга. Например, нельзя
построить дом без окон или без дверей.
2. ДР имеет строгую последовательность исполнения — от терминальных
узлов вверх к родительским (см. нумерацию в скобках). Например, в
примере строительство дома начинается строго с «Вырыть котлован» и
завершается в корневом узле ДР «Построить дом».
3. В ДР сразу видны зависимые (последовательные) друг от друга
процессы и независимые (параллельные). Например, результаты
«Сделать окна», «Сделать двери», «Сделать крышу» можно достигать
независимо (находятся на одном уровне ДР), а вот «Сделать стены» не
получится раньше, чем «Сделать фундамент».

Подробнее про правило №4
Подробнее про правило №4

Выбор требуемого результата и поиск способа его достижения
Чем отличается машина от живого организма?
Организм динамически решает вопрос: “Что делать?” и затем “Как делать?”, а
для машины вопрос “Что делать?” уже решён конструктором машины.
"Анохин П.К. А69 Избранные труды: Кибернетика функциональных систем/Под ред. К.В. Судакова"

Многомерный образ требуемого результата
Пример образа требуемого результата:
Сказка "Серебряное блюдечко и наливное яблочко": "Машенька села в уголок горницы, покатила наливное яблочко по серебряному блюдечку, поет-приговаривает: - Катись, катись, яблочко наливное, по серебряному блюдечку,
покажи мне и города и поля, покажи мне леса, и моря, покажи мне гор высоту и небес красоту, всю родимую Русь-матушку."

-3

Создадим устройство “птица Говорун”
“Мы ждали, не заговорит ли говорун снова. Но говорун закрыл глаза и сунул голову под крыло.
- Значит, Второй капитан попал в беду и послал говоруна за помощью, — сказала Алиса. — Как же заставить говоруна всё нам рассказать?”
“Путешествие Алисы” Кир Булычёв

Что требуется сделать?
Устройство, которое получает Текст на входе и выполняет текстовую команду
“Покажи <параметр>” .
За основу возьмём устройство “AGIFA-Попугай”.

Сценарий использования устройства
1. Вводим текстовую фразу:
покажи город
покажи лес
покажи море
2. Устройство показывает условную картинку:
город
лес
море

Требования к устройству:
1. Устройство должно использовать механизм Подражание (реализован в задаче Попугай)
2. Устройство должно уметь выбирать требуемый результат и способ его достижения

Зачем потребуется Подражание?
Механизм подражания, который уже реализован в задаче Попугай,
потребуется для того, чтобы Устройство самостоятельно научилось при
помощи Учителя, выполнять команды Учителя.

Зачем потребуется “Выбор требуемого результата и поиск способа его достижения”
Механизм достижения требуемого результата потребуется для того, чтобы
Устройство могло максимально точно и быстро выполнять команды Учителя.
Пояснение
Механизм подражания, даже ничего не запоминая, имеет возможность
синтезировать выходной сигнал, с заданной точностью, похожий на входной.
В данной задаче, нам потребуется выполнять текстовое задание Учителя, а не
получать на выходе сигнал, похожий на входной.
Следовательно, потребуется некий дополнительный к Подражанию механизм.

Сценарий №1 обучения Учителем Говоруна
1. Входные данные: текст, 3 картинки.
2. Допущение: вместо картинок могут быть индексы картинок в БД, т.к.
индексы картинок легко можно преобразовать в картинки.
3. Учитель пишет текстом фразу: “Покажи город”.
4. Учитель вводит текстом индекс картинки “Город”.
5. Учитель пишет текстом фразу: “Покажи лес”.
6. Учитель вводит текстом индекс картинки “Лес”.
7. Учитель пишет текстом фразу: “Покажи море”.
8. Учитель вводит текстом индекс картинки “Море”.

Сценарий №2 обучения Учителем Говоруна
1. Входные данные: текст, 3 картинки.
2. Допущение: вместо картинок могут быть индексы картинок в БД, т.к. индексы картинок легко можно преобразовать в картинки.
3. Учитель пишет текстом фразу: “Покажи город”.
4. Учитель, через запятую вводит индексы всех картинок: 1,2,3.
5. Говорун, в соответствии с алгоритмом Подражания, перебирает варианты картинок, сначала пишет 1, затем 2, затем 3.
6. Программный интерфейс, после каждого ответа Говоруна, должен спросить у
Учителя: “Правильно (да, нет)?”
7. Учитель должен ответить “да” или “нет”.
8. Далее Учитель пишет текстом фразу: “Покажи лес”.
9. Аналогично, п.4-7
10. Далее Учитель пишет текстом фразу: “Покажи море”.
11. Аналогично, п.4-7

Сравнение с обучением ребёнка
Ребёнок использует обе схемы.
Однако, у ребёнка отсутствует:
1. встроенный в интерфейс индекс картинки (схема №1)
2. встроенный в интерфейс вопрос “Правильно (да, нет)?” (схема №2)
Вместо них:
1. единственная правильная картинка в поле зрения
2. одновременно 3 картинки в поле зрения + навык указания пальцем на одну из картинок
У текстового Говоруна пока ещё нет подсистемы зрения и лап или клюва для возможности указания на картинку, поэтому подсистема зрения временно заменяется встроенными в интерфейс функциями.

Сценарий проверки знаний Говоруна
1. Учитель вводит текст “Покажи город”
2. Говорун должен ответить: 1 (индекс картинки Город)
3. Учитель вводит текст “Покажи лес”
4. Говорун должен ответить: 2 (индекс картинки Лес)
5. Учитель вводит текст “Покажи море”
6. Говорун должен ответить: 3 (индекс картинки Море)

Схема запоминания в ДР подражанием
Схема запоминания в ДР подражанием

Алгоритм выбора требуемого результата
1. Учитель пишет текстом фразу: “Покажи море”.
2. Алгоритм проходит по узлам ДР “Покажи” до развилки: “город”, “лес”,
“море”.
3. Выбирает движение по ветви “море”.
4. Активирует дальнейшее действие “3”.
5. Интерфейс преобразует действие “3” в картинку “море” и отображает её
на экране.

Алгоритм поиска требуемого результата
1. Интерфейс определяет требуемый результат, заданный индексом действия: 1, 2 или 3.
2. Из родительского узла (1, 2 или 3) разворачиваем дочернюю ветку ДР до
текущего активного узла ДР.
3. Если дошли до терминального узла и не встретили текущего, то требуемый результат пока недостижим - “недостаточно знаний”.
4. Иначе, проходим по ветке от текущего активного узла к родительскому.
Пояснение: в многомодальной системе, требуемый результат определяется
сигналом из другой модальности или потребностью “тела”.

Алгоритм поиска требуемого результата
п.3 Если дошли до терминального узла и не встретили текущего, то требуемый
результат пока недостижим - “недостаточно знаний”.
Как получить недостающие знания?
В этом случае, активируется “ориентировочно-исследовательская реакция”, т.е.
синтез вариантов различных действий - см. описание механизма подражания
https://github.com/LiveBaster/agifa/blob/main/docs/agi_for_all_2_011.pdf .
Синтез вариантов может исполняться немедленно, либо позже - после выбора
лучшего из найденных вариантов.
Например, можно во сне синтезировать варианты, а проснуться с готовой
периодической таблицей химических элементов.

Почему так просто?
Потому что ДР синтезируется в памяти посредством механизма подражания
с достаточной точностью.
Все операции по выбору и поиску требуемого результата выполняются в
ограниченном объёме памяти, которой достаточно для решения требуемого
объёма задач.
Мало доступной памяти - меньше точность АРД.
Много доступной памяти - выше точность АРД.

“Говорун - отличается умом и сообразительностью”

-5

Содержимое слоёв - это по сути модели Окружающей среды, синтезированные механизмом
Подражания, с требуемой или заданной точностью.
2. Слои могут регулярно “отключаться” - спать или снижать активность. Это даёт возможность мыслить независимо от окружающей среды.
3. Типы слоёв восприятия зависят от типов датчиков: оптические, акустические, обонятельные, вкусовые, тактильные, температурные, висцеральные, кинестетические, статические, болевые.

Внутренний и внешний мир

-6

Чем лучше внутренний мир соответствует внешнему миру - тем система разумнее.

Сборка сложных систем из БКР

-7

Сложные системы собираются из большого количества БКР посредством соединений по схеме “Родитель-Ребёнок”.
Таким образом, возможно выстраивать иерархии функциональных систем, управляющих каким-либо телом.

Саморегуляция
“Что такое саморегуляция в широком смысле слова? Это такая система
взаимодействий, при которой само отклонение функций от нормы служит
стимулом к возвращению нормы.”
"Анохин П.К. А69 Избранные труды: Кибернетика функциональных
систем/Под ред. К.В. Судакова"

Схема реализации саморегуляции в БКР

-8

Разум - это развитие саморегуляции
Допустим, роботу требуется пройти в дверной проём.
Что является регулируемым параметром?
Отклонение по горизонтали центра тела робота от центра дверного проёма.
Чем эта задача отличается от задачи регулирования уровня кровяного
давления?
Ничем, кроме сложности:
● роботу нужно зрение, органы перемещения и т.п.
● кровеносной системе зрение и прочее не требуется