Найти в Дзене

Как работает нейронная сеть

Искусственный интеллект — термин, обобщающий попытки научить компьютер сложному, сродни человеческому, мышлению — в отличие от обработки фиксированных, когда-то запрограммированных функций. Компьютер сам программирует, он учится на своем и чужом опыте и способен справляться с новыми ситуациями.

Особым методом в рамках ИИ является машинное обучение, представляющий собой подход к обучению на собственном опыте. Это означает, что компьютер изучает шаблон, полученный из общих данных, выводит правило, которое соответствует шаблону как можно лучше, и применяет правило к новым данным. Как можно лучше - не значит «стопроцентно», то есть в самом подходе заложена определенная вероятность. Компьютер сталкивается с новыми, ранее неизвестными данными, и использует их для получения наибольшего приближения к шаблону, но решение все же может быть ошибочным.

В рамках машинного обучения существуют разные подходы к программированию самообучающихся систем - контролируемое и неконтролируемое обучение. В первом случае человек говорит компьютеру, что он должен выучить («это изображение котика — научись распознавать новые изображения котиков»), во втором — компьютер должен сам находить структуры в данных и сортировать их, но интерпретировать их могут только люди.

Термин «нейронная сеть» заимствован из биологии. В человеческом мозгу нейрон представляет собой нервную клетку, связанную с другими нервными клетками. Нейрон передает им электрические сигналы. Мозг состоит из миллиардов нейронов, и наш разум состоит из активности наших нейронов.

Искусственная нейронная сеть работает аналогичным образом: здесь нейрон — это математическая формула, которая обрабатывает входные данные и генерирует на их основе выходные данные. Большое число искусственных нейронов, работая вместе, образуют искусственную нейронную сеть (ИНС).

Сначала нейронная сеть переводит изображение, пиксель за пикселем, в значения, которые могут быть вычислены нейронами. Источник изображения: https://www.wfb-bremen.de/de/page/stories/digitalisierung-industrie40/was-ist-ein-neuronales-netz
Сначала нейронная сеть переводит изображение, пиксель за пикселем, в значения, которые могут быть вычислены нейронами. Источник изображения: https://www.wfb-bremen.de/de/page/stories/digitalisierung-industrie40/was-ist-ein-neuronales-netz

В качестве примера рассмотрим нейронную сеть, задача которой отличать изображения яблок от изображений груш. Нейронным сетям нужны данные, результаты которых известны, чтобы учиться на них. Этот процесс называется «обучением» — сеть выполняет расчет и смотрит, соответствует ли он ожидаемому результату.

Затем нейронная сеть делает следующее: берет изображение, преобразует каждый пиксель в данные (например, присваивает значение цвету), использует эти данные для вычисления результата по определенной формуле, затем результат сравнивает с эталоном.

Если результат расчета и эталонные данные совпадают, сеть правильно распознала изображение. Если не совпадают, то расчет пока еще не верен и нужно продолжить обучение.

Существуют разные формы нейронных сетей, но в основном они состоят из нескольких уровней: входной уровень, на который поступает сигнал, различные промежуточные уровни, выполняющие вычисления, и выходной уровень, который представляет результат вычисления.

В примере с фруктами нейрон первого уровня получает входные данные (например, значение цвета пикселя), обрабатывает эту информацию (вычисляет формулу), а затем передает результат нейронам следующего уровня. Последний уровень соответствует двум возможным выходам — яблоко или груша.

Случайно выбранные параметры отдельных нейронов изначально приводят к случайному и, следовательно, неверному ответу. Источник изображения: https://www.wfb-bremen.de/de/page/stories/digitalisierung-industrie40/was-ist-ein-neuronales-netz
Случайно выбранные параметры отдельных нейронов изначально приводят к случайному и, следовательно, неверному ответу. Источник изображения: https://www.wfb-bremen.de/de/page/stories/digitalisierung-industrie40/was-ist-ein-neuronales-netz

Когда нейронная сеть впервые получает данные, ее результаты всегда случайны и, следовательно, также могут быть ошибочными. Это связано с тем, что во время первого тренировочного прогона параметры математических формул приходится выбирать случайным образом, поскольку мы не знаем точной формулы, с помощью которой можно отличить яблоки от чего-либо еще. Но затем случайные значения отдельных нейронов корректируются. Для этого сеть использует различные сложные формулы.

Нейронная сеть проводит расчеты не через знания, а методом проб и ошибок — она оптимизирует отдельные значения до тех пор, пока фактический результат не будет соответствовать желаемому.

Затем эти шаги повторяются — от многих тысяч до многих миллионов раз, и не только с одним изображением, но и с множеством разных изображений яблок и груш. Каждый раз значения нейрона немного меняются. Сеть начинает лучше различать яблоки и груши с ростом количества правильных решений. Этот процесс называется «обучением» и требует больших вычислительных ресурсов.

В конце этого процесса нейроны становятся настолько приспособленными к данной задаче, что уже могут отличать изображения яблок от изображений груш. И вот тут в дело вступает «магия»: нейронная сеть начинает не только различать изображения, которые она уже «знает», а может делать это даже с изображениями, которые никогда раньше не видела.

Сравнивая результат с эталоном, ИНС может постепенно обучать свои нейроны давать правильный ответ. Источник изображения: https://www.wfb-bremen.de/de/page/stories/digitalisierung-industrie40/was-ist-ein-neuronales-netz
Сравнивая результат с эталоном, ИНС может постепенно обучать свои нейроны давать правильный ответ. Источник изображения: https://www.wfb-bremen.de/de/page/stories/digitalisierung-industrie40/was-ist-ein-neuronales-netz

Пути принятия решений искусственным интеллектом, т.е. причина, по которой ИИ выбирает «яблоко», напрямую не понятны, поэтому иногда говорят о «черном ящике». Для человеческой интуиции неочевидно, как ИНС пришла к своему выводу (потому что компьютер не мыслит категориями «продолговатый» или «зеленый»).

Однако процесс принятия решения по каждому отдельному изображению можно проследить, хотя он представлен очень сложной математической формулой, которая определяется тысячами или миллионами параметров.

Каждая нейронная сеть хороша настолько, насколько хороши обучающие данные. Поэтому для обучения важно использовать хорошо отсортированные и единообразно структурированные данные.

Если сеть, обученная распознавать яблоки, внезапно столкнется с изображениями пожарных машин, она либо ничего не сможет сделать, либо ошибочно классифицирует их как яблоки. Чтобы иметь возможность работать с новой, другой информацией, ИНС необходимо будет заново обучить.

#искусственный интеллект #технологии будущего #технологии #наука и техника #it-технологии #машинное обучение #наука и образование #цифровизация #инновации #будущее

-5

Магистратура ВИШ МИФИ готовит специалистов в области цифровой трансформации жизни, цифровой трансформации экономики, цифровой трансформации технологии и индустрии.

Наука
7 млн интересуются