моделирование естественного интеллекта (да, мы сделали это)

Как мы научились моделировать интеллект и теперь ищем таланты со знанием теории групп, алгебры Ли и всего такого

6 минут

1 прочтение

26 апреля 2022

Кто мы

Comexp — разработчик технологии на базе теории активного восприятия TAPe (Theory of Active Perception). Наш новый сайт в разработке, вот его английская версия.

TAPe моделирует то, что можно назвать языком мышления, то есть работу врожденных механизмов восприятия человека. Термин “язык мышления” впервые предложил Джерри Фодор, а что это такое можно почитать на сайте Стэнфорда, например.

Моделирование врожденных механизмов позволяет разрабатывать технологии в области компьютерного зрения принципиально иного уровня, чем сейчас. Но TAPe применима далеко за пределами CV. С помощью TAPe можно строить другие архитектуры нейронных сетей, а также другие архитектуры компьютерных процессоров. И даже не можно, а нужно: ни одна из существующих архитектур нейронок и ни один из существующих методов не позволяет раскрываться TAPe, поскольку TAPe работает с более сложными единицами информации — с образами (об этом см. ниже).

Дело в том, что технологии так называемого искусственного интеллекта ограничены, они могут решать довольно узкий класс задач. Их сложно подготовить для решения какой-то одной конкретной задачи, а для решения другой нужно обучать уже другую нейронку. Улучшение результатов хотя бы на 1% требует много ресурсов, как финансовых, так и временных.

Мы же утверждаем, что TAPe позволяет создать такую технологию, которая может решать любые задачи распознавания, без необходимости каждый раз обучать нейросеть распознаванию нового класса объектов.

Немного самых общих подробностей о TAPe

В основе TAPe — математическая модель, основанная на теории групп. TAPe оперирует образами, а не массивами структурно несвязных чисел (например, нулями и единицами, как это делают современные компьютеры). Это позволяет в единице информации — бит — передавать намного больше значимой информации. Нам пришлось ввести новую единицу или новый термин t-бит — бит информации, полученный с помощью TAPe.

Что такое образ и зачем он нужен

Образ — это описание на подмножестве максимально информативных связанных элементов информации. Образы не различаются по типам информации, то есть один и тот же образ может описывать совершенно разные типы информации: изображения, текст, видео, звук. Из-за этого для любого класса задач объемы вычислительных операции сокращаются на порядки.

Можно попробовать это показать на простой схеме. Компьютерному зрению, прежде чем “увидеть” стол и “понять”, что перед ним именно стол, нужно преобразовать картинку в нули и единицы, соотнести эти нули и единицы со своей базой данных, и потом уже “понять”, что это стол. Наш мозг обходится без таких операций. Он сразу видит и сразу понимает, что перед ним стол. TAPe, моделирующее человеческое восприятие, тоже сразу “видит” и “понимает”, что перед ним стол.

Внутри t-бита уже зашита возможность распознавать (воспринимать) любой класс информации. Если так, то не нужно будет под каждую задачу распознавания разных классов объектов писать и обучать отдельную нейронную сеть. TAPe будет способна распознавать любые классы объектов без предварительного обучения.

Повторимся, что компьютерное зрение - лишь малая часть, где может быть эффективно применима TAPe. Как мы уже говорили, с точки зрения TAPe информация не различается на классы, информацию можно передавать готовыми значимыми образами, а не просто 0 и 1. Это открывает принципиально новые возможности. Уже сейчас мы знаем об изоморфизме между технологиями компьютерного зрения и естественным языком, текстами. Для нас очевидно, что информация через другие органы чувств - уши, язык, нос кожа и тд - также передается в мозг с помощью тех же “образов”. Эти образы мы и научились математически описывать.

Что TAPe умеет делать уже сейчас

Сейчас мы изучаем и другие возможности TAPe, и параллельно реализуем задачи, которые возможно решать с помощью технологий на базе TAPe. Мы разработали поиск видео по видео (повторяем: именно видео по видео, а не по мета-данным, хэш-функциям, фингерпринтам и вотермаркам и т.д. и т.п. как в других системах - эти методы далеко не всегда достаточны для поиска нужного видео).

Такой поиск позволяет, например, быстро находить нужное видео, искать дубликаты, готовить отчеты (наборы видео) на заданную тему и т.д. – зависит от задач. В том числе мы разрабатываем функции поиска конкретных объектов в массиве видео. Ну и уже больше десяти лет работает коммерческий проект по мониторингу ТВ-рекламы (и любого другого видео) в режиме реального времени.

Что потом

В более или менее обозримом будущем мы видим перспективы по разработке технологий ЕИ (Естественного Интеллекта) и машинного обучения для различных задач на принципах ТАРе, вычислительных машин и АЛУ (арифметико-логическое устройство), работающих на принципах ТАРе. Здесь же можно упомянуть хранение, передачу и управление информацией на принципах ТАРе, которые на порядки эффективней современных систем.

TAPe позволяет говорить об эмуляции или моделировании естественного интеллекта, и мы считаем, что можно говорить и о решении принципиально иных с точки зрения сложности задач. В отличии от ИИ в новых типах алгоритмов благодаря TAPe одни и те же первичные данные будут позволять решать различные задачи. Ведь существующие системы ИИ этого не могут: любая новая задача требует новой выборки, нового обучения, новой настройки (мы повторяемся, но это приходится делать). С TAPe возможно готовить первичные данные таким образом, чтобы на основе их решать абсолютно разные задачи. Матаппарат, выборка, обучение, настройка по TAPe идентичны для любого класса задач.

Мы считаем, что так как TAPe моделирует восприятие информации человеческим мозгом, то нет никаких ограничений, чтобы разработать продукты и технологии, которые максимально приближаются по эффективности восприятия к естественному интеллекту.

Кого мы ищем

Мы продолжаем работать над развитием TAPe, над проектами на базе TAPe, над изучением возможностей TAPe. Для этого нам нужны в команду люди, а также мы предлагаем команды, мини-группы, артели, коммуны и т.п. к сотрудничеству. Называйтесь как хотите.

Итак, кто нам нужен/кого мы ищем.

Математиков, знакомых с программированием на питоне. Вероятно, в возрасте 21-23 года (по крайней мере, в душе)

Нам нужны математики со специализацией в алгебре Ли, теории групп, а также вкладывающие какой-то смысл в понятие алгебры гармонии. Также эти люди не должны бояться писать на питоне и/или использовать питоновские библиотеки. Теперь про возраст. Попахивает эйджизмом, но про возраст мы скорее пишем не в качестве пожелания, а в качестве прогноза. В таком возрасте человек, как правило, еще не обременен ипотекой, застарелыми и не всегда нужными привычками, он открыт миру, новым задачам, у него, простите, “горят глаза”, “чешутся руки” попробовать сделать что-то действительно новое. Если вам 70, но в душе 21-23 года - вероятно, вы тоже нам подходите.

Люди/команды/проекты, которые хотят попробовать изучить нашу теорию и сделать на ней собственные проекты

Мы понимаем, что не можем придумать все возможные сценарии использования TAPe, и потому готовы делиться нашими знаниями. Представьте, что мы открыли электричество и с помощью него изобрели лампу накаливания - и только. На большее нас пока не хватило. Ничего страшного — все остальное пусть изобретут другие люди, нам не жалко. Может быть, это будете вы.

Мы не будем претендовать на блокирующие доли, лезть в ваш бизнес и т.п. Мы на определенных условиях раскроем нашу теорию и построенную на её базе технологию, а вы делаете с этим, что хотите.

Если вас заинтересовала наша работа и наше предложение, а также если у вас есть вопросы — вы можете связаться с нами по почте tape@comexp.net.