1597 подписчиков

Как обучается искусственный интеллект? Часть 1

15 апреля 202215 апр 2022

303

3 мин

Оглавление

Что понятно человеку, не совсем понятно машине
Как учится машина?

Да, да, друзья. ИИ также нужно обучать. Иначе, как автомобиль с автопилотом разберется, что перед перед ним стоит человек и требуется остановка? Или, как найти злоумышленника с записей уличных камер? Как говорил, дедушка Ленин: "Учиться, учиться и еще раз учиться!"

С вами канал “Цифровое просвещение”. Здесь трём за все, что связано с IT-сферой. И, да, у нас есть печеньки. Так что велком на темную сторону!

Что понятно человеку, не совсем понятно машине

Что вы видите на картинке? Птицу, собаку и лошадь. Очевидно! Вам! Но не для нейросети. Для нее все 3 картинки одинаковы. Почему? Потому что на всех 3 есть белые квадратики в черной окантовке. Машине проще и легче “прицепиться” к таким маркерам.

И это оправдано с точки зрения сбережения ресурсов. Все мозги устроены одинаково, что органические, что машинные. Только у нас - это лень, а у ИИ - оптимизация процессов с учетом затрат.

Этот пример - типичная иллюстрация опасности машинного обучения. Алгоритм может выделить на изображении вообще все, что угодно. А в дальнейшем строить свои действия на основе ошибочного вывода. То есть неверная классификация данных, как она есть.

Есть даже такой спецтермин - отравление данных (data poisoning). И хитроумные хакеры или просто безумцы уже вовсю пробуют эти приемы чтобы нарушить модели машинного обучения и глубинного обучения.

При должном подходе злоумышленник получает бэкдор к процессам и сможет потом обойти защиту систем под управлением ИИ. Вот почему искать такие лазейки очень важно.

Как учится машина?

Методом нелинейных алгоритмов. Когда путь к цели - не свод жестких правил. Когда нужны и возможны вариации. Если попросить человека найти на картинке собаку, то в мозге начинается сложнейший процесс поиска и фильтрации информации. Какие признаки есть у собаки? Есть ли они на фото?

Классическая модель - Если- То (if-else) работает не везде, существуют смысловые блоки, которые невозможно разбить на символьные конструкции.

Да, с чисто математическими задачами у ИИ проблем нет. Потому что обучение - это массив строго алгебраических правил. Но как только речь заходит о других компетенциях, где требуется некий чувственный опыт - начинаются проблемы.

Возьмем перспективное направление - Компьютерного зрения. То есть в этой области ИИ отвечает за распознавание, понимание и обработку визуальной информации. Наш пример с птичками и собачками как раз оттуда.

Однако изучение всего возможного объема изображений не дает 100% результата. Как вы уже поняли, алгоритм ищет самые короткие пути. И сравнивая между собой фото собак, людей и мотоциклов, алгоритм начнет искать ответ и сопутствующие метки. И если на фото с собаками будут какие-нибудь метки (автор снимка, к примеру), то ИИ сделает простой вывод - там, где есть метка автора - изображены собаки.

Еще пример: ИИ исследует многочисленные фотки с пастбищами и овечками. Так вот, нейросеть вскоре переключится на писк пастбищ, а не овец. Программа идет по пути наименьшего сопротивления и ищет самый ЗНАКОВЫЙ признак.

Так уже было со стартапом по обучению нейросети поиску признаков меланомы. Дело в том, что ученые допустили одну ошибку - на каждом фото была масштабная линейка возле новообразования. Что сделал после этого ИИ?

Верно, прицепился к линейкам и выдавал диагноз только исходя из обнаруженного им паттерна. То есть найти линейку оказалось ПРОЩЕ, чем разбираться в нюансах оттенка родинок, кожи и т.д.

Есть и менее очевидные пиксельные отпечатки. Они возникают при наложении аппаратных, цифровых и других факторов. И тогда при анализе визуальной информации наступил следующая ошибка. Если 10 из 15 фотографий собак были сделаны камерой №1, то ИИ выдаст результат - Собака - только на фотки камеры №1. Все остальные изображения он не идентифицирует как собаку. Так как остальные 5 фото сделали другие устройства.

Аналогичные “косяки” встречались в областях искусственного интеллекта, по распознаванию живой речи (NLP), анализе сводных текстовых или цифровых данных - истории продаж, биржевых котировок и т.д.

ПО следует за сильными “раздражителями”, а не за логикой связей между ними.

И вот тут наступает время состязаний…

Продолжение следует…

Всем высоких скоростей и удачи!

Кстати, по поводу железа, ПО и прочих услуг. Если загляните на официальный сайт нашей компании, то найдете много, чего интересного.

Друзья, в связи с нововведениями Дзена выживут лишь те каналы, где есть подписки. Если наш канал Вам интересен, мы попросим вас подписаться и порекомендовать его другим подписчикам! Спасибо за понимание!

А еще обязательно заходите в наши соц. сети, там вас ждет еще больше нового интересного контента:

Телеграм канал