Найти в Дзене
Ура роботам!

Существует ли искусственный интеллект?

В наше неспокойное время на тему искусственного интеллекта высказываются все, кому ни лень. Зачастую эти люди не имеют даже приблизительного представления о предмете разговора. Отсюда в широкие массы проникают различные сюжеты из фантастических произведений о взбесившемся искусственном интеллекте и войне человечества с роботами. Это создаёт у неподготовленных людей тревогу и депрессию. Для противоборства этому я постараюсь предельно простым языком ответить на самые распространенные вопросы об ИИ: На 2024 г. самыми популярными и зрелищными образцами ИИ являются программы генерации текста и изображений, по ключевым словам или другим изображениям. Имеются также программы для генерации музыки, 3D моделей, наложения эффектов видео и прочие, но они пока еще не так хороши. Как правило ИИ представлены в виде различных чат-ботов или программ-генераторов. Такие программы действительно являются мощными помощниками студентам, продавцам, кол-центрам, дизайнерам и т. д. Самым известным сервисом демо
Оглавление

Никакого искусственного интеллекта, с возможностями присущей человеку осознанной деятельности, не существует и не будет существовать, в обозримой перспективе.

В наше неспокойное время на тему искусственного интеллекта высказываются все, кому ни лень. Зачастую эти люди не имеют даже приблизительного представления о предмете разговора. Отсюда в широкие массы проникают различные сюжеты из фантастических произведений о взбесившемся искусственном интеллекте и войне человечества с роботами. Это создаёт у неподготовленных людей тревогу и депрессию. Для противоборства этому я постараюсь предельно простым языком ответить на самые распространенные вопросы об ИИ:

  • Что обычно сегодня понимается под искусственным интеллектом?
  • Как работает искусственный интеллект?
  • Откуда взялись нейросети?
  • Что такое нейросеть?
  • Что может нейросеть?
  • Почему искусственный интеллект не может выйти за пределы программы?
  • Проблема создания искусственного интеллекта с осознанной деятельностью.

Что обычно сегодня понимается под искусственным интеллектом?

На 2024 г. самыми популярными и зрелищными образцами ИИ являются программы генерации текста и изображений, по ключевым словам или другим изображениям. Имеются также программы для генерации музыки, 3D моделей, наложения эффектов видео и прочие, но они пока еще не так хороши. Как правило ИИ представлены в виде различных чат-ботов или программ-генераторов. Такие программы действительно являются мощными помощниками студентам, продавцам, кол-центрам, дизайнерам и т. д.

Самым известным сервисом демонстрирующим работу ИИ является популярный chatGPT от компании OpenAI, представляющий собой онлайн-чат, в котором можно обычным языком (включая русский) переписываться с ботом и просить его предоставить какую-либо информацию или сделать какие-нибудь задания, результат чего можно вывести в виде текста на экран.

В России получил распространение сервис yaGPT, разработанный на базе chatGPT.

Наиболее продвинутыми и популярными сервисами генерации картинок являются Midjourney (бесплатная русская версия от Яндекса - Шедеврум) и Stable Diffusion. Stable Diffusion имеет свободно распространяемое приложение с мощными API и множество дополнений. С помощью API можно встраивать Stable Diffusion в свои программы или интегрировать со своим сайтом.

Программы с элементами ИИ, предназначенные для узкого профессионального использования называются экспертными системами. Это различные приложения для распознавания образов, действий, поиска каких-либо закономерностей в данных.

Как работает искусственный интеллект?

ИИ - это прежде всего компьютерная программа, написанная людьми и для людей. Программа - это алгоритм придуманный соответствующим специалистом - программистом, и записанный на каком-либо языке программирования. Любой алгоритм подразумевает под собой постановку задачи, которую он должен решить, т. е. программа не способна сама себе поставить задачу, а тем более самостоятельно разработать какую-либо серьёзную программу.

Существует два основных способа решения алгоритмических задач:

1. Использование формальной логики, когда результат проверки условий может иметь только два значения: истина или ложь. В зависимости от чего и выполняется следующее действие алгоритма.

2. Использование нечеткой логики (в программной реализации она всё равно содержит в себе операции формальной логики), когда результат проверки условий может иметь сразу много вариантов значений. Результат такого сравнения не обязательно будет однозначным. Примером такой математической структуры является нейросеть.

Откуда взялись нейросети?

Все операции классического алгоритма, от начала и до конца, определены программистом, но бывают ситуации, когда формальное описание необходимых условий и действий программы очень сложно и громоздко. Чтобы упростить себе работу, программистами были взяты на вооружения нейронные сети - алгоритмы нечеткой логики, работа которых имитирует работу живых нейронов, придуманные биологами для своих исследовательских целей.

Первую действующую модель нейросети "Персептрон" разработал в 1958 году американский нейробиолог Френк Розенблатт. Но ввиду узкого круга решаемых задач, широкого практического распространения он не получил. Затем, по мере роста производительности компьютеров, исследователи придумывали всё более сложные и совершенные алгоритмы. Важный вклад в современные нейросетевые модели сделал советский ученый А.И. Галушкин, впервые описавший принцип обратного распространения ошибки, а чуть позднее создатели ассоциативных и самоорганизующихся моделей: Д. Хопфильд и Т. Коххонен.

Новый этап развития нейросетей состоялся в 2017 году, когда исследователями из Google Brain была опубликована нейросетевая модель Трансформер. Быстро выяснилось, что увеличение размеров нейросети такой модели даёт прогрессивный результат. Так, первая модель chatGPT состояла из сотен миллионов элементов, а знаменитый chatGPT3, представленный общественности в 2022 году, обрабатывал на входе уже 175 миллиардов, и составлял целые эссе уже практически как человек.

Поэтому настоящий бум и даже целая общественная истерия, началась только в 2022 году, с выходом chatGPT3 и Midjourney.

Что такое нейросеть?

Любая нейросеть построена на основе логических элементов - математических нейронов. Каждый такой нейрон представляет из себя некое количество входных параметров и выходное значение. В процессе обработки элемента (нейрона) нейросети, происходит определение его состояния, путём вычисления нелинейной функции от комбинации входных сигналов с учетом специального коэффициента (называемого весом элемента), который устанавливается для каждого элемента в процессе обучения или работы нейросети.

Схема элемента (нейрона) компьютерной нейросети, где X - входные данные, W - сумма элементов, F(x) - функция
Схема элемента (нейрона) компьютерной нейросети, где X - входные данные, W - сумма элементов, F(x) - функция

Простейшим примером компьютерной нейросети является Персептрон, состоящий из трёх рядов элементов:

  • S-элементы — слой сенсоров, аналогичных рецептору живого нейрона;
  • A-элементы, называемые ассоциативными, потому что каждому такому элементу, как правило, соответствует целый набор (ассоциация) S-элементов;
  • R-элемент, называемый "реагирующим", который подсчитывает сумму значений входных сигналов, помноженных на веса.
Схема Персептрона
Схема Персептрона

В наши дни, практически все современные популярные ИИ-сервисы используют нейросетевую модель "Трансформер". Архитектура Трансформера состоит из "кодировщика" и "декодировщика". Кодировщик получает на вход векторизованную последовательность с позиционной информацией. Декодировщик получает на вход часть этой последовательности и выход Кодировщика. Кодировщик и Декодировщик состоят из слоев. Слои Кодировщика последовательно передают результат следующему слою в качестве его входа. Слои Декодировщика последовательно передают результат следующему слою вместе с результатом кодировщика, в качестве его входа. По этой причине, модели типа Трансформера, иногда еще называют "каскадные".

Нейросетевая архитектура "Трансформер"
Нейросетевая архитектура "Трансформер"

Модель Трансформер сразу же показала свой высокий потенциал в генерации текстов и картинок. Многие группы исследователей кинулись разрабатывать на архитектуре Трансформера собственные модели.

Для того, чтобы нейросеть могла решать какие-либо задачи, необходимо провести её обучение. Современные нейросети обучаются с помощью специальных программных алгоритмов. Вкратце, суть обучения заключается в последовательной подаче на вход и выход нейросети большого количества пар данных, исходя их чего нейросеть каждый раз перестраивает свою структуру (пересчитывает веса элементов), аналогично тому, как это делается, в нервной системы животных. Конечно элемент компьютерной нейросети имеет намного более упрощенную математическую модель, чем в живой нейрон, но принцип его работы схож с нервной системой животных.

После завершения обучения, нейросеть сможет самостоятельно выдавать результат на выходе, причем чем длительнее было обучение, тем точнее будет результат, при некачественных данных на входе. Современные модели нейросетей, типа Трансформера, могут обучаться прямо в процессе работы.

Что может нейросеть?

Работа современной компьютерной нейросети, грубо говоря, заключается в "размазывании" входных параметров по элементам нейросети и обратной их концентрации в виде результата.

Схема работы сервиса генерации картинок Stable Diffusion
Схема работы сервиса генерации картинок Stable Diffusion

Подобная схема работы позволяет "слеплять" все загруженные в процессе обучения нейросети данные в один большой цифровой "ком", а затем, в процессе работы, получать компиляцию имеющихся данных. Причем, чем больше данных было загружено в нейросеть, чем больше размер этой нейросети, тем более качественным и детальным будет результат этой компиляции.

В сравнении с классическими логическими алгоритмами, нейросеть для своей работы требует огромное количество вычислительных ресурсов. Это обуславливается тем, что она состоит из большого количества элементов, каждый из которых необходимо вычислить. Если классический алгоритм в своей работе бы "точечно" выполнил бы проверку набора условий, то нейросеть для получения результата, каждый раз должна вычисляться полностью.

Преимуществом применения нейросети является её высокая универсальность. Поскольку нейросеть фактически оперирует образами данных, то при их недостаточном качестве, она всё равно подберёт наиболее близкий к запросу образ. Для классического алгоритма пришлось бы составлять математические модели для входных данных и определять огромное количество условий для вычисления результата.

Почему искусственный интеллект не может выйти за пределы программы?

Как мы разобрали выше, любая современная нейросеть, несмотря на свои огромные размеры, всё еще имеет довольно примитивную и однотипную архитектуру. Она способна работать только с тем, что в неё загружено, и не способна оперировать неоднородными образами.

Увеличиваются вычислительные мощности, увеличиваются до астрономических цифр сенсорные ряды нейросетей, меняется местами порядок передачи данных между рядами, но ничего принципиально нового с 1958 года так изобретено и не было.

Да, современные сервисы, построенные на компьютерных нейронных сетях, иногда производят сильное впечатление на неподготовленного зрителя, но это до сих пор всё еще ловко подогнанные цитаты или ладно склеенные части картинок, из того огромного контента, который был загружен при обучении, за который нейросеть выйти физически не может.

Проблема создания искусственного интеллекта с осознанной деятельностью.

Главным органом высшей нервной деятельности большинства животных является мозг. Это очень сложный объект, с множеством разнородных отделов, в основном специализирующихся на определенном функционале, но при необходимости, способных подменять функции соседних отделов.

Головной мозг содержит порядка 90 млрд нейронов и где-то еще столько же вспомогательных клеток. По совпадению, это примерно тот же порядок количества логических элементов, что и в chatGPT3, который в контексте текстового чата, уже довольно сложно отличить от человека. Таким образом разработчики уже фактически подобрались по вычислительным возможностям человеческого мозга, хотя и в чрезвычайно упрощенном варианте, который обладает следующими недостатками:

  • схема работы виртуального нейрона очень примитивна, в сравнении с живой нервной клеткой;
  • какая-либо специализация отделов нейросети отсутствует, в отличие от живого мозга, где различные отделы имеют различающуюся структуру нервной ткани, для достижения более эффективного результата своей работы;
  • отсутствие внутреннего возбуждения (мотивации) нейросети, делает невозможным какую-либо активную деятельность за пределами данных направляемых на вход нейросети;
  • обучение нейросети краткосрочно и очень узко специализировано, а человек (любое животное) учит свою живую нейросеть всю жизнь, прямо с рождения.

Таким образом мы видим, что несмотря на сопоставимые вычислительные возможности, компьютерная нейросеть даже близко не сопоставима с человеком по своим когнитивным возможностям. Она оперируется очень ограниченными и однородными загруженными данными, что катастрофически сужает ее возможности по экстраполяции образов, и сводит свою работу лишь к их рекомбинации.

Если мы хотим получить ИИ напоминающий деятельность человека, то мы должны создать человека, провести его длительное обучение, как человека, и предоставить возможность ставить жизненные опыты, как человек. Но предпосылок ко всему этому, в обозримой перспективе, не предвидится.

Так выглядит ИИ по версии Stable diffusion
Так выглядит ИИ по версии Stable diffusion