КАКОВЫ ОСНОВНЫЕ ВИДЫ МАШИННОГО ОБУЧЕНИЯ?
Машинное обучение обычно делится на две основные категории: обучение под наблюдением и обучение без надзора.
ЧТО ТАКОЕ КОНТРОЛИРУЕМОЕ ОБУЧЕНИЕ?
Этот подход в основном учит машины на собственном примере.
Во время обучения для контролируемого обучения системы подвергаются воздействию большого количества помеченных данных, например изображений рукописных рисунков, снабженных аннотациями, указывающими, какому номеру они соответствуют. Учитывая достаточное количество примеров, система контролируемого обучения научилась бы распознавать скопления пикселей и фигур, связанных с каждым числом, и в конечном итоге смогла бы распознавать написанные от руки числа, способные надежно различать числа 9 и 4 или 6 и 8.
Однако для обучения этих систем, как правило, требуется огромное количество помеченных данных, при этом некоторым системам для выполнения задачи необходимо ознакомиться с миллионами примеров.
В результате наборы данных, используемые для обучения этих систем, могут быть обширными: набор данных Google Open Images содержит около девяти миллионов изображений, его хранилище видео с метками YouTube-8M, связанное с семью миллионами помеченных видео, и ImageNet, одна из первых баз данных такого рода, содержит более 14 миллионов изображений с категориями. Размер обучающих наборов данных продолжает расти, и Facebook объявил, что собрал 3,5 миллиарда изображений, общедоступных в Instagram, используя хэштеги, прикрепленные к каждому изображению в качестве меток. Использование миллиарда этих фотографий для обучения системы распознавания изображений дало рекордный уровень точности-85,4% – по сравнению с эталоном ImageNet.
Трудоемкий процесс маркировки наборов данных, используемых в обучении, часто выполняется с использованием сервисов краудворкинга, таких как Amazon Mechanical Turk, которые предоставляют доступ к большому количеству дешевой рабочей силы, разбросанной по всему миру. Например, ImageNet был собран за два года почти 50 000 человек, в основном набранных через Amazon Mechanical Turk. Тем не менее, подход Facebook к использованию общедоступных данных для обучающих систем может обеспечить альтернативный способ обучения систем, использующих миллиардные наборы данных, без накладных расходов на ручную маркировку.
ЧТО ТАКОЕ ОБУЧЕНИЕ БЕЗ ПРИСМОТРА?
В отличие от этого, алгоритмы неконтролируемого обучения решают задачи с выявлением закономерностей в данных, пытаясь обнаружить сходства, которые разделяют эти данные на категории.
Примером может быть объединение Airbnb домов, доступных для аренды по районам, или группировка новостей Google по похожим темам каждый день.
Алгоритмы неконтролируемого обучения не предназначены для выделения определенных типов данных, они просто ищут данные, которые можно сгруппировать по сходствам, или для выявления аномалий, которые выделяются.
ЧТО ТАКОЕ ОБУЧЕНИЕ ПОД НАБЛЮДЕНИЕМ?
Важность огромных наборов помеченных данных для обучающих систем машинного обучения может со временем уменьшиться из-за роста обучения под контролем.
Как следует из названия, этот подход сочетает в себе контролируемое и неконтролируемое обучение. Этот метод основан на использовании небольшого количества помеченных данных и большого количества немаркированных данных для обучения систем. Помеченные данные используются для частичного обучения модели машинного обучения, а затем эта частично обученная модель используется для маркировки немаркированных данных, процесс называется псевдомаркировкой. Затем модель обучается полученному сочетанию помеченных и псевдомаркированных данных.
Жизнеспособность обучения под полуправлением в последнее время повысилась за счет создания сетей состязательности (GAN), систем машинного обучения, которые могут использовать помеченные данные для создания совершенно новых данных, которые, в свою очередь, могут быть использованы для обучения модели машинного обучения.
Если бы обучение под наблюдением стало таким же эффективным, как обучение под наблюдением, то доступ к огромным объемам вычислительной мощности мог бы оказаться более важным для успешного обучения систем машинного обучения, чем доступ к большим, помеченным наборам данных.
ЧТО ТАКОЕ ОБУЧЕНИЕ С ПОДКРЕПЛЕНИЕМ?
Способ понять обучение с подкреплением-это подумать о том, как кто-то может впервые научиться играть в компьютерную игру старой школы, когда он не знаком с правилами или с тем, как управлять игрой. Хотя они могут быть полными новичками, в конечном счете, если посмотреть на взаимосвязь между кнопками, которые они нажимают, тем, что происходит на экране, и их результатами в игре, их производительность будет становиться все лучше и лучше.
Примером обучения с подкреплением является глубокая Q-сеть Google DeepMind, которая победила людей в широком спектре старинных видеоигр. Система получает пиксели из каждой игры и определяет различную информацию о состоянии игры, такую как расстояние между объектами на экране. Затем он рассматривает, как состояние игры и действия, которые она выполняет в игре, связаны с достигнутым счетом.
В процессе многих циклов игры, в конечном счете, система строит модель того, какие действия будут максимизировать счет, в каких обстоятельствах, например, в случае прорыва видеоигры, куда следует переместить весло, чтобы перехватить мяч.
КАК РАБОТАЕТ КОНТРОЛИРУЕМОЕ МАШИННОЕ ОБУЧЕНИЕ?
Все начинается с обучения модели машинного обучения, математической функции, способной многократно изменять то, как она работает, до тех пор, пока она не сможет делать точные прогнозы при получении свежих данных.
Перед началом обучения вам сначала нужно выбрать, какие данные собирать, и решить, какие функции данных важны.
Чрезвычайно упрощенный пример того, что такое функции данных, приведен в этом объяснителе Google, где модель машинного обучения обучена распознавать разницу между пивом и вином на основе двух характеристик: цвета напитков и их объема алкоголя (ABV).
Важно отметить, что данные должны быть сбалансированы, в данном случае, чтобы иметь примерно равное количество примеров пива и вина.