Найти тему

5+4 Мифа о машинном обучении. Часть первая.

Как и любая хайповая история, машинное обучение быстро обросло мифами, и мифы плодятся со страшной силой, пора их развенчивать, а то они превратятся в классику жанра, как в своё время превратились Мифы древней Греции. Машинное обучение зачастую бывает слишком эффективным инструментом, чтобы кто-то не придумал очередной миф, слишком уж благодатная почва. По опросу Accenture 42%, руководителей сказали, что к 2022 году большинство инноваций будет так или иначе связанно с Искусственным интеллектом. Но важно в этой шумихе разобраться, где ложные ожидания, а где просто путаница понятий.

Миф: Машинное обучение = ИИ

Машинное обучение этот просто методика Искусственного интеллекта, которая распознаёт закономерности, паттерны поведения, используя большие данные и обучаясь на схожих задачах. Само понятие ИИ шире, чем просто машинное обучение, оно покрывает: компьютерное зрение, роботехнику, распознавание и обработку речи и т.п.

Миф: все данные полезны

Машину можно и запутать, если вы дадите ей массив нерелевантных данных. Она, как настоящий трудяга пережует всё, что вы ей скормите, найдёт и там и сям закономерности, которые может даже вам покажутся привлекательными, но всё это от «цифрового лукавого». Данные для решения задачи должны быть репрезентативными, очищенными, до определённых пределов, конечно.

Миф: нужно очень много данных.

Если данные качественные, как я писал выше, то благодаря некоему трюку под названием Transfer learning можно существенно сократить объём данных для получения качественных результатов. Так работают Salesforce и Microsoft Azure, им для обучения достаточно показать 30-50 изображений, показывающих, что вы хотите классифицировать. Стоит отметить, что математики не сидят сложа руки и постоянно улучшают алгоритмы и зачастую небольшие компании, имея талантливых математиков дают более качественные результаты вычислений, чем крупные разработчики. Возьмите это себе на заметку.

Миф: любой может сделать систему машинного обучения.

Полтора года назад Google открыл свои библиотеки с алгоритмами и благодаря этому они стали доступны любому, Facebook, Baidu, Яндекс тоже стали выкладывать свои решения в открытый доступ, упала цена разработок и вдобавок можно найти бесчисленное количество курсов, описаний настройки машинного обучения и других источников информации по машинному обучению.

Но машинное обучение по-прежнему является областью для специалистов, т.к. там много работы не только с алгоритмами обучения, но и с подготовкой данных, разбивкой их на разделы, тестирования, в конце концов нужно понимать какой выбрать алгоритм для машинного обучения. Конечно, можно и зайца научить курить, но для качественного результата нужно обращаться к опытным специалистам, причём возраст — это не критерий качественного специалиста, часто молодые специалисты обладают хорошими навыками.

Миф: все паттерны полезны.

Искусственный интеллект хорош, но при машинном обучении человеку тоже нужно включать свою голову. Хороший пример из медицины. У больных астмой, сердечников и у тех, кому за 100 лет выживаемость от пневмонии выше, чем вы ожидаете. Причём настолько хорошая выживаемость, что система машинного обучения может их отправить домой вместо госпитализации. В чём же причина высокой выживаемости у таких больных? Может сами догадались? Ответ состоит в том, что эти люди имея проблемы с легкими при первом же подозрении начинают сразу лечение или устраняют факторы, которые могут привести к пневмонии, а отнюдь не от богатырского здоровья. Если у вас расчёты ведутся по модели «черный ящик» - на входе информация, а на выходе результат, то вы не сможете узнать, на основании каких поведенческих моделей было принято то или иное решение. По возможности избегайте таких ситуаций.

На сегодня я рассказал о пяти Мифах про машинное обучение, завтра продолжу. Я надеюсь, что в первую очередь рассказ про эти «мифы» будет полезен людям из бизнеса, чтобы они могли иметь общее представление о возможности ИИ, базу для принятия управленческих решений.

До завтра!

Присылайте удачные примеры внедрения машинного обучения и искусственного интеллекта в ритейле для концепции Магазина 4.0.

Автор Борис Агатов,

Независимый эксперт по внедрению инноваций в ритейле, автор концепции "Магазин 4.0"

От автора: «Провожу корпоративные семинары по теме: "Как открыть Магазин 4.0 без ошибок"

Создаю стратегию магазина 4.0, консультирую, помогаю разобраться в новых технологиях для ритейла, сравнить аналоги и выбрать оптимальный вариант для вашего бизнеса и дать новый импульс развития вашей компании при помощи новых технологий.

Связывайтесь через Facebook:

Больше информации здесь https://www.facebook.com/boris.agatov