В 1961 году Дональд Михи, британский разработчик ПО и исследователь Искусственного Интеллекта, разработал MENACE (механизм машинного обучения крестикам и ноликам). По сути, это была одна из первых программ, которая могла научиться играть и выигрывать в крестики и нолики. На работу его вдохновили беседы с Аланом Тьюрингом о том, можно ли запрограммировать компьютеры на обучение на их собственном опыте.
Поскольку в то время компьютера у него не было, он создал устройство из спичечных коробков и стеклянных шариков для того, чтобы имитировать алгоритм обучения.
Несколько лет назад Жюльен Превьё, являющийся одним из самых интересных художников современности, воссоздал машину в форме прекрасного деревянного предмета мебели. В MENACE 2 можно поиграть прямо сейчас в Kunsthalle Wien, где она является частью выставки под названием Promise of Total Automation, которая посвящена машинам и их потенциалу для нашего развития и порабощения.
Принцип работы MENACE
Есть 304 маленьких деревянных ящичка или спичечных коробка. Каждый из них представляет хранилище вариантов ходов на доске, с которыми игрок может столкнуться во время игры. Каждый ящичек заполнен цветными бусинами, которые представляют разные варианты ходов.
Процесс обучения методом проб и ошибок включает в себя наказание за проигрыш и вознаграждение за победу. Этот тип машинного обучения получил название «Обучение с подкреплением».
MENACE всегда ходит первой
Первый ход: оператор открывает верхний левый спичечный коробок или ящичек, в котором отображается пустая доска. Открывает её и вынимает случайный шарик. Цвет этой бусинки определяет пространство, которое MENACE пометит своей фигурой. Игрок отмечает ход на доске и кладёт бусинку в специальное место на ящичке для хранения памяти о сделанном ходе.
Второй ход: его делает человек.
Третий ход: игрок ищет ящик, в котором отображена текущая раскладка доски, открывает его и вынимает случайный шарик. Цвет шарика определяет клетку, которую MENACE отметит крестиком или ноликом.
Четвёртый ход: человек преграждает путь крестиков или ноликов MENACE.
Если MENACE проигрывает, бусинки из памяти на ящиках выбрасываются в мешочек. Так обучающаяся система не повторит свои предыдущие шаги. Если игра с MENACE закончилась ничьей, то в коробочку последнего хода добавляется ещё один шарик, цвет которого соответствовал ходу, приведшему к ничьей. Если MENACE выигрывает, то в коробку последнего хода добавляется ещё три шарика, что повышает вероятность повторения выигрышных ходов в следующие разы.
Вот такой вот деревянный Искусственный Интеллект. Эта технология — больше не тема научно-фантастических романов. Это целая область исследований, которая быстро развивается и рассматривается некоторыми людьми как, то, что отберёт у нас работу и будет следить за нашей жизнью.
Источник: we-make-money-not-art