I8Путь к естественному интеллекту
Глава 1
Обработчик сигналов.
В повседневной жизни мы не задумываемся, почему нам нравится стейк или апельсин. Он жареный, сочный и мясистый, а мы голодные. Благодаря теории Дарвина ученые, к счастью, уже могут нам объяснить, почему же нам нравится стейк. Потому что в процессе естественного отбора погибли все, кто эти стейки просто напросто не любил. Выжили те, кто жарил мясо на огне, а своими огромными челюстями сумели пожертвовать в пользу большего размера мозга. Мозг оставшихся в живых тонко настроен на факт, что жареный стейк – хорошо. В мозге за поедание такого блюда выделяется ряд гормонов, активирующих центр удовольствия. Эти гормоны – дофамин и серотонин, и еще несколько, образуют коктейль определенной концентрации, на который в нашем мозге реагирует так называемый обработчик или интерпретатор сигналов. Каждый сигнал как музыка, состоящая из некоторого ряда нот. Стейк – своеобразная сумма сигналов нервной системы, в том числе зрительной, обонятельной, вкусовой. Три этих системы дают определенную неповторимую сумму, которую наш обработчик интерпретируют как «хорошо» (выработалось это в следствии естественного отбора !!!), и дальше отправляет сигнал «хорошо» в наше сознание, так мы чувствуем удовлетворение. Но что в точности мы чувствуем ? Вряд ли кто-то сможет словами описать чувство счастья. Но если ощущения нельзя описать словами, по крайней мере их можно описать в математических числах.
Итак, выводы – мы не в состоянии решить за обработчик, плоха какая-то вещь или хороша. В организме человека роль этого обработчика играет небольшой орган под названием гипоталамус. Размер этого органа примерно с ноготь, а соединен он со всей нервной системой, абсолютно со всем мозгом. Именно этот орган решает за нас, что в пустыне нам хочется стакан воды, стоящий по среди стола. Его тонкая настройка сама происходит в процессе эволюции, и решает он, а не мы. Простейший пример – родилось у родителей поколение, в котором у одного детеныша обработчик интерпретирует апельсин как вкусно, а у другого детеныша обработчик интерпретирует апельсин как не вкусно. Тут нужно сделать заметку из биологии, что следующее поколение может иметь не только признаки отца и матери, но и случайные признаки из-за мутаций. В дальнейшем накопление этих случайных признаков дает преимущества некоторым потомкам через многие поколения, а другие ветви, не имеющие таких преимуществ, или умирают в борьбе, или просто вымирают без еды. Либо же сосуществуют на разных территориях далеко друг от друга. Ну так вот, про апельсины. Один из детей стал жить дольше на 20 лет из-за витаминов от апельсина, и распространил свои гены сильнее. Через 10000 лет вся популяция людей любит апельсины, потому что все кто их не любил давно вымерли. А что такое любовь к апельсину ? Это ответ нейросети на мелодию сигналов нервной системы. Это ответ обработчика сигналов, преобразование суммы сигналов функцией обработчика в «хорошо» или в «плохо». Можно это эмулировать на любом современном языке программирования. Обычные нейросети умеют определять апельсин на картинке. А что если бы эта нейросеть определяла по картинке, плохо это или хорошо ? Показываешь ты ей апельсин, она отвечает хорошо, показываешь змею – отвечает «плохо». Натренировать сеть можно самому, случайно меняя коэффициенты и объясняя, что апельсин хорошо а змея это плохо, а можно дать ей развиваться самой, только нужно окружение.
Глава 2
Окружение нейросети.
Что нужно нейросети для саморазвития ? Нужны условия, которые заставят ее это делать, в том числе мотивация и возможности для саморазвития. Нужен естественный отбор. Создадим простейшую модель человека в пустом виртуальном пространстве. К каждой такой модели мы привяжем собственную нейросеть. Научим для начала ходить этих пока еще ботов. Нужно эмулировать около 50 мышц в теле, для начала. Эффективно управляя мышцами, нейросеть будет уметь перемещаться по пространству. За эффективное перемещение награждать, давая плюсики сети. Те же плюсики, что дает обработчик сигналов. Такое уже эмулируется на сегодняшний день, можно найти много видео Youtube, где разные смешные роботы учатся делать свои первые шаги. Но не все так просто. Наш бот будет перемещаться в пространстве эффективнее, чем больше параметров на входе в нейросеть мы имеем. Во первых это конечно машинное зрение. Во вторую очередь идет машинное осязание. Мы поделим поверхность 3д модели на небольшие кусочки, что-то вроде пиксельной кожи, и каждый кусочек будет иметь параметр, задевает его что-то или нет. Так, например ступни будут условно чувствовать землю, что даст более плавное движение в конечном резуллтате после обучения. Так же нужно добавить на вход параметры от виртуального гироскопа в виртуальной голове. 3 параметра смещения по осям X Y Z, определяющих наклон головы или всего тела, а так же силу ускорения и его возможный вектор, для более точной координации в пространстве. Вся вместе эта система будет напоминать своеобразный можжечек, который имеется в организмах всех позвоночных.
А что дальше ? Дальше нужно научить их размножаться. Если мы начали эмулировать людей, нужно эмулировать их полностью. К примеру мы создали виртуальных мужчину и женщину. Можно запрограммировать, что чем ближе их половые органы, тем больше плюсиков удовлетворения падает. Но как только наши ребята закончили все свои дела, плюсики переставали падать на определенное время. Пусть не только сексом занимаются, у нас же есть дела по важнее.
По этой же схеме нужно научить их употреблять пищу. Наш бот уже немного умеет управлять своим телом, попробуем эмулировать ему движения рук. Ловкие кисти рук не такая уж сложная вещь для нынешних нейросетей. Создадим рядом с ним виртуальный апельсин. И будем перемешивать веса нейросети до тех пор, пока его обработчик сигналов не решит что апельсин – хорошо. И что есть его через рот – хорошо. После этого наше виртуальное существо будет есть ртом виртуальные апельсины, все какие найдет в своем виртуальном пустом пространстве.
При этом модель человека будет обладать виртуальным зрением, причем получать картинку именно через глаза, и желательно в стереорежиме для 2 глаз. Ещё виртаульным слухом в определенном радиусе, например 40 дб в пределах 10 метров и чем ближе сигнал, тем он громче, чем дальше тем он тише. Еще нужно обоняние, осязание, вкус. Все это эмулируется легко. В простой эмуляции запах может состоять из 50 разных оттенков, составляющих композицию, на которую реагирует хорошо или плохо обработчик сигналов. Каждый предмет в симуляции тоже имеет такой параметр как запах. Предположим тухлое мясо в симуляции имеет какие то случайные коэффициенты. Для нейросети это просто числа, ей нет реального дела до того, как оно пахнет, потому что никакого запаха на самом деле там не существует, есть только набор коэффициентов. Кому-то оно нравится, кому-то нет. Те кому этот запах нравится, съедают мясо и умирают быстрее. Так в будущих поколениях закрепится, что запах тухлого мяса – это плохо. Еще раз, нет никаких запахов в объективной реальности, запах вещь сугубо субъективная, это не вещественная вещь, запах это отношение мозга или нейросети к набору молекул или коэффициентов в виртуальном мире.
Со вкусом все точно так же, с осязанием уже более сложно, но само по себе осязание не так важно в развитии организма как зрение и слух. Осязание это либо метод взаимодействия с чем-то, либо это метод для ответной реакции на что-то. Например физическую боль от удара. В этом плане осязание более важно. Для наших виртуальных ботов можно эмулировать, что при сильных ударах он не сможет использовать какие-то мышцы и движениям придется слегка переучиваться. Так же при получении урона, в виде ударов или чего-то еще по-опаснее обработчик сигналов воспринимал эти ситуации как «плохо», стараясь не повторять в будущих поколениях. Те кто любит удары, боль воспринимается как положительная эмоция. У этих существ быстро бы выходили из строя все мышцы и другие функции его виртуального организма, что в итоге ограничивало бы возможность размножения.