Да, да, друзья. ИИ также нужно обучать. Иначе, как автомобиль с автопилотом разберется, что перед перед ним стоит человек и требуется остановка? Или, как найти злоумышленника с записей уличных камер? Как говорил, дедушка Ленин: "Учиться, учиться и еще раз учиться!"
С вами канал “Цифровое просвещение”. Здесь трём за все, что связано с IT-сферой. И, да, у нас есть печеньки. Так что велком на темную сторону!
Что понятно человеку, не совсем понятно машине
Что вы видите на картинке? Птицу, собаку и лошадь. Очевидно! Вам! Но не для нейросети. Для нее все 3 картинки одинаковы. Почему? Потому что на всех 3 есть белые квадратики в черной окантовке. Машине проще и легче “прицепиться” к таким маркерам.
И это оправдано с точки зрения сбережения ресурсов. Все мозги устроены одинаково, что органические, что машинные. Только у нас - это лень, а у ИИ - оптимизация процессов с учетом затрат.
Этот пример - типичная иллюстрация опасности машинного обучения. Алгоритм может выделить на изображении вообще все, что угодно. А в дальнейшем строить свои действия на основе ошибочного вывода. То есть неверная классификация данных, как она есть.
Есть даже такой спецтермин - отравление данных (data poisoning). И хитроумные хакеры или просто безумцы уже вовсю пробуют эти приемы чтобы нарушить модели машинного обучения и глубинного обучения.
При должном подходе злоумышленник получает бэкдор к процессам и сможет потом обойти защиту систем под управлением ИИ. Вот почему искать такие лазейки очень важно.
Как учится машина?
Методом нелинейных алгоритмов. Когда путь к цели - не свод жестких правил. Когда нужны и возможны вариации. Если попросить человека найти на картинке собаку, то в мозге начинается сложнейший процесс поиска и фильтрации информации. Какие признаки есть у собаки? Есть ли они на фото?
Классическая модель - Если- То (if-else) работает не везде, существуют смысловые блоки, которые невозможно разбить на символьные конструкции.
Да, с чисто математическими задачами у ИИ проблем нет. Потому что обучение - это массив строго алгебраических правил. Но как только речь заходит о других компетенциях, где требуется некий чувственный опыт - начинаются проблемы.
Возьмем перспективное направление - Компьютерного зрения. То есть в этой области ИИ отвечает за распознавание, понимание и обработку визуальной информации. Наш пример с птичками и собачками как раз оттуда.
Однако изучение всего возможного объема изображений не дает 100% результата. Как вы уже поняли, алгоритм ищет самые короткие пути. И сравнивая между собой фото собак, людей и мотоциклов, алгоритм начнет искать ответ и сопутствующие метки. И если на фото с собаками будут какие-нибудь метки (автор снимка, к примеру), то ИИ сделает простой вывод - там, где есть метка автора - изображены собаки.
Еще пример: ИИ исследует многочисленные фотки с пастбищами и овечками. Так вот, нейросеть вскоре переключится на писк пастбищ, а не овец. Программа идет по пути наименьшего сопротивления и ищет самый ЗНАКОВЫЙ признак.
Так уже было со стартапом по обучению нейросети поиску признаков меланомы. Дело в том, что ученые допустили одну ошибку - на каждом фото была масштабная линейка возле новообразования. Что сделал после этого ИИ?
Верно, прицепился к линейкам и выдавал диагноз только исходя из обнаруженного им паттерна. То есть найти линейку оказалось ПРОЩЕ, чем разбираться в нюансах оттенка родинок, кожи и т.д.
Есть и менее очевидные пиксельные отпечатки. Они возникают при наложении аппаратных, цифровых и других факторов. И тогда при анализе визуальной информации наступил следующая ошибка. Если 10 из 15 фотографий собак были сделаны камерой №1, то ИИ выдаст результат - Собака - только на фотки камеры №1. Все остальные изображения он не идентифицирует как собаку. Так как остальные 5 фото сделали другие устройства.
Аналогичные “косяки” встречались в областях искусственного интеллекта, по распознаванию живой речи (NLP), анализе сводных текстовых или цифровых данных - истории продаж, биржевых котировок и т.д.
ПО следует за сильными “раздражителями”, а не за логикой связей между ними.
И вот тут наступает время состязаний…
Продолжение следует…
Всем высоких скоростей и удачи!
Кстати, по поводу железа, ПО и прочих услуг. Если загляните на официальный сайт нашей компании, то найдете много, чего интересного.
Друзья, в связи с нововведениями Дзена выживут лишь те каналы, где есть подписки. Если наш канал Вам интересен, мы попросим вас подписаться и порекомендовать его другим подписчикам! Спасибо за понимание!
А еще обязательно заходите в наши соц. сети, там вас ждет еще больше нового интересного контента: