Найти в Дзене
BaseIT

Искуственный интеллект. Как работают нейросети?

В статье "Как устроен компьютер" мы проводили мысленный эксперимент принимая обычный компьютер к нам на работу стажером. Мы учили его печатать тексты и выполнять простейшие команды. Ознакомьтесь, если вам интересно. А теперь представьте. Наш «программно-аппаратный стажер», которого мы так долго учили складывать двоичные числа и послушно выполнять команды, вдруг подходит к вам ранним осенним утром и заявляет: «Шеф, а я, кажется, научился распознавать котиков на фотографиях». ТЬФУУУУУ! Выплевываете вы только что заваренный кофе. Ты что такое несешь, железяка!? Это уже не просто сложение! Это уже что-то из области разума, творчества, чего-то... фантастического. Как же так вышло? Неужели наш бездушный исполнитель, понимающий только «ноль» и «единицу», вдруг обрёл сознание? Спойлер: нет. Но он научился блестяще притворяться. И имя этому притворству — нейросеть. Для начала, давайте разберемся как мы с вами учимся чему-то новому. Ответьте на вопрос, где на этой фотографии котёнок, а где ще

В статье "Как устроен компьютер" мы проводили мысленный эксперимент принимая обычный компьютер к нам на работу стажером. Мы учили его печатать тексты и выполнять простейшие команды. Ознакомьтесь, если вам интересно.

А теперь представьте. Наш «программно-аппаратный стажер», которого мы так долго учили складывать двоичные числа и послушно выполнять команды, вдруг подходит к вам ранним осенним утром и заявляет: «Шеф, а я, кажется, научился распознавать котиков на фотографиях».

ТЬФУУУУУ!

Выплевываете вы только что заваренный кофе. Ты что такое несешь, железяка!? Это уже не просто сложение! Это уже что-то из области разума, творчества, чего-то... фантастического.

Как же так вышло? Неужели наш бездушный исполнитель, понимающий только «ноль» и «единицу», вдруг обрёл сознание?

Спойлер: нет. Но он научился блестяще притворяться. И имя этому притворству — нейросеть.

Для начала, давайте разберемся как мы с вами учимся чему-то новому.

Ответьте на вопрос, где на этой фотографии котёнок, а где щенок?

Котёнок и щенок. Или наоборот?
Котёнок и щенок. Или наоборот?

По какому признаку, вы это поняли?

Скорее всего описать один признак вы не сможете, тем не менее по совокупности признаков, мы абсолютно точно знаем, что котик слева. Почему? Потому что мы видели и котиков и собачек не одну сотню раз и знаем чем они отличаются.

Покажите годовалому ребёнку десять фотографий кошек и десять фотографий собак. Он быстро уловит разницу. Он не учит формулы «маленькие уши + пушистый хвост = кошка». Он просто смотрит и интуитивно улавливает некие закономерности.

Нейросеть — это попытка скопировать этот принцип. Не запрограммировать жёсткие правила, а дать возможность алгоритму самому найти эти правила в куче данных.

- Как ты относишься к тому, что ты не настоящий искусственный интеллект, а всего лишь алгоритм находящий закономерности?
- Как по мне, это даже круче, чем настоящее мышление.
DeepSeek

Как работает этот алгоритм?

Он состоит из трех простых шагов:

  1. Загрузка данных для обучения.
  2. Хотим распознавать котиков? Значит, подаём сюда много картинок, состоящих из пикселей. Каждый пиксель — это один «нейрон» на входе.
  3. Обучение.
  4. Внутри "мозга" нашей нейросети находятся тысячи, а то и миллионы «нейронов», связанных друг с другом. Каждое соединение имеет свой «вес» — это как сила влияния одного нейрона на другой.
  5. Результат.
  6. После всех внутренних вычислений нейросеть выдаёт результат. Например: «Кошка — 95%», «Собака — 4%», «Тапок — 1%».

Вся магия заключается в этих самых «весах». Изначально, когда сеть только родилась, все весы выставлены случайным образом. Она несёт полную чушь и называет и тапок кошкой, и жирафа — собакой.

Как происходит процесс обучения? Мы действуем как строгий, но справедливый учитель.

  1. Показываем пример: Даём сети фотографию кошки.
  2. Слушаем ответ: Она выдаёт, например: «Тапок — 70%».
  3. Даём подзатыльник (алгоритмический): Компьютер смотрит на её ответ и на правильный ответ («КОШКА!»), и вычисляет ошибку — насколько она облажалась.
  4. Исправляем «мозги»: А вот тут ключевой момент! Алгоритм идёт обратно и немного подкручивает все «веса» так, чтобы в следующий раз вероятность ответа «кошка» стала чуть-чуть выше.

И мы повторяем это. Миллионы раз. С тысячами картинок кошек, собак и тапок. Сеть, получая миллионы таких «подзатыльников», постепенно, методом тыка, настраивает свои миллионы «винтиков»-весов так, чтобы в итоге выдавать правильные ответы.

Именно так работают чат-боты и автоответчики. Они не «понимают» ваши вопросы. Они вычисляют, какая последовательность слов с наибольшей вероятностью должна идти в ответе, основываясь на триллионах прочитанных текстов.

Разберем на примере

Допустим, мы решили обучить нашего стажера отвечать на телефонные звонки. Для начала научим его отвечать на фразу "Как дела?".

Первым делом, мы загружаем данные для обучения, а именно набор слов, которые можно использовать в качестве ответа:

(привет, как, дела, норм, отлично, синий, а, у, меня, тоже, что, нового, спасибо, ок, котик, тапок, четыре, слышал, круто, бывает).

Мы подаем на вход слова "Как"+"дела", а задача нейросети подобрать подходящий ответ "норм", "отлично", "круто".

При первом проходе, сеть выставит на каждое слово из своего словаря случайные параметры "весов". Например:

  • "тапок" — 20%
  • "отлично" — 15%
  • "ок" — 10%
  • ... остальное раскидано как попало.

И выдаст нам ответ с наибольшей вероятностью - "тапок".

Правильным ответом, были бы слова "норм", "отлично", "круто". Алгоритм начинает расследование - почему в ответ на "как дела" выбрали "тапок"? Потому что у "тапок" был самый большой вес - 20%. Мы уменьшаем вес этого параметра и приподнимаем вес других.

Теперь настало время для второго прогона. Уже скорректированные веса выглядят следующим образом:

  • "отлично" — 20%
  • "ок" — 15%
  • "тапок" — 10%
  • ... остальное раскидано как попало.

Теперь нейросеть выдаст нам ответ - "отлично". Как раз то, что мы от неё ожидали.

Убедившись, что это правильный ответ, алгоритм ещё повысит вероятность ответа "отлично" и понизит все остальные.

Важно, что смысла всех этих слов, нейросеть не понимает, она просто знает, что после слова "как дела" с высокой вероятностью подойдет ответ "отлично".

После этого мы совершаем ещё один прогон, в котором окажется, что слова "норм" и "круто" тоже подойдут в качестве ответа, однако не с такой большой вероятностью как "отлично".

Примерные итоговые коэффициенты будут выглядеть так:

  • "отлично" — 80%
  • "круто" — 10%
  • "норм" — 9%
  • ... остальное ~1%.

Является ли в таком случае нейросеть настоящим искусственным интеллектом, как в фантастических фильмах и книгах ?

Конечно, нет. Нейросеть — это просто очень сложный статистический калькулятор. Она не понимает, что такое «кошка», «красота» или «смысл». Она просто научилась вычислять, что определённая комбинация пикселей с огромной вероятностью соответствует той комбинации, которую люди в своих данных пометили как «кошка».

Мы не создали ИИ. Мы создали инструмент, который умеет находить сверхсложные закономерности там, где нашего человеческого мозга уже недостаточно.

  • Перевод текстов? — Найти закономерности между языками.
  • Рекомендации фильмов? — Найти закономерности в ваших предпочтениях.
  • Беспилотные автомобили? — Найти закономерности в том, как выглядят пешеходы, знаки и другие машины.

Так что наш стажер не поумнел. Он просто получил в своё распоряжение новый, мощный математический аппарат, который позволяет ему имитировать результаты человеческого мышления, оставаясь при этом внутри всё той же двоичной системы из нулей и единиц.

Нейросеть создала картину и продала ее за $432,500.
Коллеги-художники возмутились: 'Это плагиат!'
На что ИИ ответил: 'Вы учились по картинам предков, а я — по вашим селфи в Instagram. Кто здесь плагиатор?'"
Нейроюмор