Работа алгоритмов, а тем более машинное обучение вызывает у многих людей недоверие. Чаще всего это происходит из-за незнания как это все работает на самом деле. Давайте разберемся с этим.
Наверняка вы встречали в последние годы обсуждения на форумах или в соцсетях об отслеживании поведения и интересов, алгоритмах, искусственном интеллекте и машинном обучении. В таких обсуждениях люди часто высказывают свои подозрения. И страх действительно имеет место. Ведь часто мы не получаем ожидаемый результат от программ, и нас это настораживает. Но на самом деле всему виной служит непонимание принципа работы машинного обучения.
Даже Дональд Трамп считает, что алгоритмы вывода постов в тренды Твиттера работают против него:
Также часто можно встретить такое популярное обсуждение в соцсетях: если в поисковике ввести любое трехзначное число и добавить к нему фразу «новые случаи», вы непременно получите новости о случаях COVID с этими точными числами, что по мнению некоторых доказывает, что COVID это обман.
Эти примеры отлично показывают, что отсутствие понимания работы алгоритмов ведет к ошибочным выводам и разочарованию в результатах работы искусственного интеллекта.
Алгоритмы все-таки бывают предвзятыми
Искусственный интеллект – это, конечно, здорово, но модели машинного обучения пишут все-таки программисты. А людям свойственно иметь предубеждения, пусть даже и неявные.
Отсутствие изучения наших неявных предубеждений при разработке, программировании, кодировании и постановке целей (в случае ниже - цели улучшить распознавание расы) в итоге может привести к плохой работе программы и ошибочным результатам ее работы.
Так из-за отсутствия разнообразия изображений, используемых для разработки основы баз данных, непригодный результат выдал сервис по распознаванию лиц. В него загрузили изображение с низким разрешением, а на выходе должны были получить реалистичное изображение человека. Для примера взяли известную фотографию президента Барака Обамы со сниженным качеством, однако в результате программа выдала изображение белого мужчины. Хотя на фото легко можно узнать, кем на самом деле был человек на пиксельном изображении.
Наряду с исходными данными, которые влияют на работу этих алгоритмов, искусственный интеллект впоследствии берет для обучения и вводимые пользователями данные для усовершенствования результатов. Алгоритмы и машинное обучение хороши ровно настолько, насколько хороша информация, которую мы скармливаем этим моделям.
Модели машинного обучения также анализируют как мы пользуемся соцсетями или поисковыми системами, а затем настраивают свою работу на основе этой информации. Это отлично срабатывает, когда мы пытаемся найти точный рецепт пиццы, но часто бывают и обидные промахи, когда в поисках важной информации мы не находим объективных источников.
Как действуют алгоритмы
Работа алгоритмов по сути направлена на то, чтобы воспроизвести и предугадать процессы принятия решений в человеческом мозгу. Алгоритмы созданы для того, чтобы люди быстрее разбирались в информации, которую способен выдать поисковик, тем самым экономя свое время на поиске.
Если упростить принцип работы алгоритмов, то они будут выглядеть как набор операторов: if-then. Это означает, что когда пользователь выбирает одно условие (if), то затем ему компьютер выдает соответствующее значение (then). И таких if-then может быть много, и в итоге мы получим такую картину: если вы сделаете A, вы получите B, а если вы сделаете C вместо этого, вы получите D.
Вы можете выполнить поиск «Пицца Чикаго» и на основе информации, которую Google имеет о вас, вашем местонахождении и истории поиска, он может дать вам рецепт пиццы или сказать, какие пиццерии есть в Чикаго.
Как работает машинное обучение
Основная идея машинного обучения заключается в том, что вводимые вами данные могут повлиять на будущие рекомендации или результаты алгоритма. Алгоритм «изучает» ваши предпочтения и принимает их во внимание при следующем использовании операторов if-then. Одним из примеров этого являются рекомендации в Инстаграм. В зависимости от того, с какими аккаунтами вы взаимодействуете, алгоритмы пытаются показать вам больше того, что, по их мнению, вы предпочитаете.
Но алгоритм может пойти и по другому пути. Если вы просматривали большое количество негативных статей, с которыми, возможно, вы не согласны (даже просто чтобы увидеть, о чем там говорится), алгоритм определит клик, а не ваше намерение, стоящее за ним. Именно такой принцип «подсовывает» в ленту Дональду Трампу плохие новости о нем из Твиттера. Результаты новостей, которые он видит, персонализированы на основе того, что алгоритм узнал о его поведении в Интернете.
У алгоритмов и машинного обучения действительно есть тайные умыслы
Больше всего в сложившейся ситуации пользователей пугает то, что искусственный интеллект уже сам способен размышлять. Конечно, мы как никогда близки к созданию iRobot, однако результаты вашей поисковой системы не созданы специально для того, чтобы обмануть вас или исказить реальность. Поисковая выдача, которую мы получаем, основана исключительно на математике.
Помните историю про трехзначное число и фразу «новые случаи»? Есть люди, которые считают, что COVID – это выдумка, поскольку для любого числа подберется точная статья о новых случаях заражения, что доказывает, что эти числа изначально ложные.
Однако этот случай наоборот наглядно демонстрирует, что существует так много источников информации, публикующих данные с такой высокой скоростью, что в Интернете достаточно информации, чтобы Google мог найти результаты для любого из этих чисел.
Поисковые системы были созданы для получения наиболее релевантных результатов для вас как пользователя. И совершенно не в их интересах не дать вам искомую информацию о чем-то в Интернете.
Однако, современные технологические платформы сделают все возможное, чтобы получить прибыль от вас как пользователя. Они собирают информацию о вашем поведении в Сети, анализируют и используют ее для своих маркетинговых проектов. Вот почему иногда кажется, что, подумав о чем-то, вы получите рекламу об этом в Facebook позже днем.
Помня о том, что эти процессы часто являются просто операторами if-then, основанными на ваших сохраненных предпочтениях, вы сможете стать более информированным потребителем контента в Интернете, а также сможете управлять поисковой выдачей.