«Матрица», «Бегущий по лезвию» и другие фантастические фильмы создали в обществе представление об искусственном интеллекте как о сверхразуме. На деле ИИ — просто математический алгоритм, который вычисляет закономерности в поведении человека и старается им подражать. О том, как работают нейросети, рассказала старший преподаватель факультета компьютерных наук НИУ ВШЭ Дарья Касьяненко на вебинаре, организованном Центром непрерывного образования.
У современного человека много заблуждений об искусственном интеллекте. Образ ИИ сильно искажен поп-культурой, и в первую очередь фильмами. «Это “Космическая одиссея” Стэнли Кубрика, где был представлен культовый персонаж Элл — искусственный интеллект, который способен пожертвовать человеческими жизнями ради достижения цели космической экспедиции. Или, например, репликанты в фильме “Бегущий по лезвию” Ридли Скотта, которых было не отличить от настоящих людей. “Матрица” Вачовски, конечно же», — перечисляет эксперт Центра непрерывного образования, старший преподаватель факультета компьютерных наук Дарья Касьяненко.
Людям порой кажется, что нейросети — это некий сверхмощный разум. Но в действительности у искусственного интеллекта есть ограничения. Например, ChatGPT — наиболее мощный чат-бот с искусственным интеллектом — всего лишь попугай, повторяющий за человеком.
ChatGPT входит в категорию GenAI — генеративного искусственного интеллекта. Это тот тип искусственного интеллекта, который генерирует тексты, изображения, музыку и все что угодно в ответ на запрос от человека.
Нейросети вроде ChatGPT еще называют большими языковыми моделями (БЯМ). БЯМ умеют генерировать тексты. Для этого их обучают на больших наборах текстовых данных. По словам разработчиков, последнюю модель ChatGPT обучали на миллионе гигабайт текстовых данных.
Обучение происходит так: в нейросеть загружают тексты, написанные человеком. Например, произведения писателей или новости из интернета. Модель анализирует эти тексты. Она берет два слова и вычисляет, как часто эти слова встречаются в тексте рядом — в одном предложении, абзаце или тексте. Когда нейросеть изучила связи между словами в языке, она может подбирать предложения, похожие на человеческие. Развитые модели могут набирать целые тексты.
«Такие модели еще называют стохастическими попугаями. Стохастический — от греческого “случайно угаданный”. То есть нейросети хорошо генерируют тексты, но не понимают их значение. В общем-то, как попугаи, которые подражают человеку», — подытожила Касьяненко.