Добавить в корзинуПозвонить
Найти в Дзене
Без IT-тишного

Нейросеть простыми словами: как учится ChatGPT и почему он не «думает»

Вы спросили у программы совет по тексту, и ответ звучит так, будто его написал живой человек. Хочется поверить, что «там кто-то сидит». На деле внутри нейросеть, программу натренировали на гигантской куче текстов. Она не читает мысли и сама не лезет в интернет. Она подбирает следующее слово, чтобы фраза звучала правдоподобно. Я Ника, главный редактор «Без IT-тишного». Без формул разберём, откуда взялась идея таких сетей, как они учатся и что происходит, когда вы пишете в ChatGPT. Ещё в середине прошлого века инженеры придумали сеть из простых узлов, по аналогии с нервными клетками. На вход подают числа, на выходе получают ответ. Долго это жило в лабораториях, потому что данных было мало, а компьютеры слабые. В 2010-е появились огромные массивы текстов в сети и мощные видеокарты. Программа стала сама подхватывать закономерности, без тысячи правил вручную. Потом вырос новый тип сети для языка, который лучше держит связь между словами. На его основе появились модели вроде GPT. В ноябре 20
Оглавление
Нейросеть - простыми словами
Нейросеть - простыми словами

Вы спросили у программы совет по тексту, и ответ звучит так, будто его написал живой человек. Хочется поверить, что «там кто-то сидит». На деле внутри нейросеть, программу натренировали на гигантской куче текстов. Она не читает мысли и сама не лезет в интернет. Она подбирает следующее слово, чтобы фраза звучала правдоподобно.

Я Ника, главный редактор «Без IT-тишного». Без формул разберём, откуда взялась идея таких сетей, как они учатся и что происходит, когда вы пишете в ChatGPT.

Откуда вообще взялась нейросеть

Ещё в середине прошлого века инженеры придумали сеть из простых узлов, по аналогии с нервными клетками. На вход подают числа, на выходе получают ответ. Долго это жило в лабораториях, потому что данных было мало, а компьютеры слабые.

В 2010-е появились огромные массивы текстов в сети и мощные видеокарты. Программа стала сама подхватывать закономерности, без тысячи правил вручную. Потом вырос новый тип сети для языка, который лучше держит связь между словами. На его основе появились модели вроде GPT. В ноябре 2022 года OpenAI открыла ChatGPT, и миллионы людей впервые массово попробовали такую модель.

Это не мозг в банке. Это очень быстрый угадыватель по шаблонам, который видел миллионы примеров и запомнил их в виде весов, внутренних коэффициентов сети. Для вас это значит, что «умный тон» в ответе не равен знанию фактов и не равен человеческому мышлению.

идея → данные → модель для текста → иконка чата
идея → данные → модель для текста → иконка чата

Из чего она состоит

Слово нейрон здесь условное, в программе это узел. Он принимает числа, умножает на коэффициенты и передаёт сигнал дальше. Узлы стоят слоями, как этажи. То есть это не биология, а математика. Три этажа в двух словах такие.

  • Входной слой принимает ваш вопрос, разбитый на кусочки, и так модель «слышит» запрос.
  • Средние слои собирают смешанные признаки, тему, тон и связи между словами, и ищут закономерности.
  • Выходной слой выдаёт вероятность следующего кусочка, и из этого по шагам собирается ответ.

Веса это главная память модели, миллиарды чисел, которые записали при обучении. Пока вы переписываетесь в чате, веса уже не переписываются. Меняется только то, что модель выдаёт на ваш конкретный запрос.

Из чего состоит нейросеть: вход → середина → выход
Из чего состоит нейросеть: вход → середина → выход

Как нейросеть учится

Обучение похоже на школу с ответами в конце учебника. Показывают пример, модель угадывает, её сравнивают с эталоном и чуть подкручивают веса. Шаг повторяют миллионы раз, неделями на серверах. Схема близка к «обучению с учителем» только масштаб другой.

Для ChatGPT добавили ещё один круг. Люди отмечают, какой из двух ответов полезнее, и модель подстраивается. Поэтому в чате ответы чаще аккуратные, а не «сырой» текст из интернета.

При обучении веса постоянно меняются, серверы считают неделями, и счёт за электричество платит компания, которая тренирует модель, а не вы. Когда вы уже пишете в чат, веса зафиксированы. Идёт только «прогон» вперёд по готовой сети, без переписывания памяти, и за этот прогон платит сервис вроде ChatGPT, а не ваш домашний роутер.

Если в обучении мало надёжных примеров по теме, например по медицине, праву или редким событиям, модель может уверенно ошибаться. Она не «знает». Она воспроизводит похожее на то, что видела.

Как работает ChatGPT, когда вы задали вопрос

Когда вы нажали «Отправить», начинается не обучение, а готовая работа уже натренированной модели.

Сначала ваш текст режут на токены, кусочки слов и частей слов. Для модели это не буквы, а коды. Затем токены проходят через все слои, и на выходе сеть оценивает, какой следующий кусочек вероятнее всего. Его добавляют к ответу, и цикл повторяется, пока не соберётся целая фраза или абзац. Представьте умное автозаполнение, которое пишет не одно слово, а целый абзац. То есть на экране вы видите гладкий текст, а внутри идёт цепочка маленьких угадываний.

Поэтому ChatGPT иногда галлюцинирует. Он заточен на правдоподобный текст, а не на проверку фактов в энциклопедии. Если звучит убедительно, это ещё не значит, что верно. Даты, суммы и «ссылки на законы» всегда перепроверяйте сами.

GPT не «думает» как человек и не помнит весь интернет. Он опирается на паттерны из обучения и на то, что вы дали в этом диалоге. И он не ищет в Google в реальном времени, если только в вашей версии не включён режим поиска. Тогда это надстройка сервиса, а не «магия узла».

Генеративный ИИ уже дошёл до десятков процентов населения, быстрее многих привычных технологий. Для вас это значит, что инструмент уже в быту, но проверяйте важное и не доверяйте слепо.

Цепочка блоков слов
Цепочка блоков слов

Что запомнить и как пользоваться

В обычной программе правила пишут вручную, и калькулятор на 2+2 всегда даёт 4. GPT вывел правила из примеров и на один и тот же вопрос может дать разные формулировки. Это нормально.

Запомните три мысли. Модель учится на примерах, а не на здравом смысле. Она отвечает вероятностями, а не истиной. И она полезна как черновик, а не как оракул.

Нейросеть выручает для черновика письма, упрощения текста или нескольких заголовков. Она не заменяет врача, юриста и банк. Факты, деньги и здоровье — это то, что не стоит доверять нейросети.

Нейросеть это слои узлов с весами из обучения. ChatGPT это оболочка, чтобы говорить с моделью простым языком. Внутри нет человека, есть статистика и «опыт» из текстов.

Если материал был полезен, подпишитесь на «Без IT-тишного».

Вопрос к вам. Вы уже пробовали ChatGPT или другой чат с ИИ? Для чего зашло больше, работа, учёба или быт? Напишите в комментариях.

Ника, главный редактор «Без IT-тишного».