2127 подписчиков

ИИ, который умеет и рак лечить, и в покер рвать

23 июля 201923 июл 2019

2 мин

Оглавление

ИИ vs покер
Методы обучения
Куда тебя понесло, Pluribus

Тот момент, когда искусственный интеллект уж слишком многозадачный.

С самого начала разработчики пояснили, что покер – тест, не более. Что его навыки будут применять в других сферах. Например, в военной. Но случился поворот не туда.

ИИ vs покер

Искусственный интеллект Libratus еще в 2017 смог обыграть человека в покер. В 2019 создали улучшенную версию программы – Plubirus. Разработчики задрали планку:

ИИ поставили цель – заработать в покере.
Было 12 соперников. В одной игре было 5 оппонентов сразу (такое впервые).
Всего было 10 000 раздач. То есть, 10 000 партий.

Ах да, среди соперников были:

Крис Фергюсон, чемпион World Series of Poker.
Даррен Элиас, рекордсмен по числу наград в World Poker Tour.

Из 10 000 игр программа выиграла все. Позже посчитали, какой был бы выигрыш, будь это игры на деньги:

Каждая раздача приносила бы 5 долларов.
В час алгоритм зарабатывал бы 1000 долларов.

Если вы хотите обчистить казино, прихватите с собой алгоритм Pluribus.

Но ключевое здесь – не то, что ИИ умеет. А то, как его учили.

Методы обучения

Обычно обучение ИИ покеру происходит так:

Выгружают базу. Правила игры и карты.
Учат предугадывать, учитывая, какие карты уже ушли, какие могут остаться.

И все это на какой-нибудь крутой серверной станции. Ведь предугадывание требует больших мощностей.

У Pluribus обучали по-другому:

Выгрузили базу. Представьте, что вы играете в покер и знаете вообще все о нем.
Спроектировали так, чтобы программа «просчитывала» 3 хода вперед.
Развили возможность блефовать.
Заставили играть против самого себя и Libratus. Отчасти, Pluribus сам себя научил.

Станция была слабее, чем обычно - 64 ядра и 512 ГБ оперативной памяти.

В итоге, ИИ создали за 8 дней, потратив 150 долларов.

Куда тебя понесло, Pluribus

Ученые хотят использовать искусственный интеллект для лечения рака и других болезней. Именно из-за методов обучения.

Недавно мы рассказывали про алгоритм, который изучил научные статьи и сам открыл химическую таблицу элементов. Да еще и предсказывал открытия. С Pluribus – то же самое.

Программа умеет анализировать, а затем предлагать варианты решения задачи, причем все. А далее – делать ход. Ученые считают, что структуру можно оставить, заменив лишь оболочку:

С «заработать денег» на «вылечить пациента».
С инфой о покере на план лечения и данные о пациенте.

Биоуправление

Это компьютерная технология, в основе которой лежит адаптивная биологическая обратная связь. Представьте, что у вас что-то болит, а описать конкретно не получается. Вас не понимают -> недуг не вылечен. Биуоправление решает эту проблему.

Что может быть лучше? Связка с искусственным интеллектом:

С помощью биоуправления ИИ узнает всё о здоровье пациента.
Далее Pluribus узнает о методах лечения.
Проанализирует, смоделирует ходы. «Когда человеку станет хорошо», «в каком случае он может умереть» и т.д.
Выдаст рекомендации по лечению и приему лекарств.

Будущее

Проект Pluribus в любом случае успешен. Ведь методы обучения дали плоды.

Пуруш Айер, доктор и один из создателей алгоритма, подчеркнул преимущество программы:

Покер – показательный пример того, как математические модели искусственного интеллекта могут решать проблемы. Наша модель не просто делает шаги поэтапно – она разрабатывает стратегию.