Тот момент, когда искусственный интеллект уж слишком многозадачный.
С самого начала разработчики пояснили, что покер – тест, не более. Что его навыки будут применять в других сферах. Например, в военной. Но случился поворот не туда.
ИИ vs покер
Искусственный интеллект Libratus еще в 2017 смог обыграть человека в покер. В 2019 создали улучшенную версию программы – Plubirus. Разработчики задрали планку:
- ИИ поставили цель – заработать в покере.
- Было 12 соперников. В одной игре было 5 оппонентов сразу (такое впервые).
- Всего было 10 000 раздач. То есть, 10 000 партий.
Ах да, среди соперников были:
- Крис Фергюсон, чемпион World Series of Poker.
- Даррен Элиас, рекордсмен по числу наград в World Poker Tour.
Из 10 000 игр программа выиграла все. Позже посчитали, какой был бы выигрыш, будь это игры на деньги:
- Каждая раздача приносила бы 5 долларов.
- В час алгоритм зарабатывал бы 1000 долларов.
Если вы хотите обчистить казино, прихватите с собой алгоритм Pluribus.
Но ключевое здесь – не то, что ИИ умеет. А то, как его учили.
Методы обучения
Обычно обучение ИИ покеру происходит так:
- Выгружают базу. Правила игры и карты.
- Учат предугадывать, учитывая, какие карты уже ушли, какие могут остаться.
И все это на какой-нибудь крутой серверной станции. Ведь предугадывание требует больших мощностей.
У Pluribus обучали по-другому:
- Выгрузили базу. Представьте, что вы играете в покер и знаете вообще все о нем.
- Спроектировали так, чтобы программа «просчитывала» 3 хода вперед.
- Заставили играть против самого себя и Libratus. Отчасти, Pluribus сам себя научил.
Станция была слабее, чем обычно - 64 ядра и 512 ГБ оперативной памяти.
В итоге, ИИ создали за 8 дней, потратив 150 долларов.
Куда тебя понесло, Pluribus
Ученые хотят использовать искусственный интеллект для лечения рака и других болезней. Именно из-за методов обучения.
Недавно мы рассказывали про алгоритм, который изучил научные статьи и сам открыл химическую таблицу элементов. Да еще и предсказывал открытия. С Pluribus – то же самое.
Программа умеет анализировать, а затем предлагать варианты решения задачи, причем все. А далее – делать ход. Ученые считают, что структуру можно оставить, заменив лишь оболочку:
- С «заработать денег» на «вылечить пациента».
- С инфой о покере на план лечения и данные о пациенте.
Биоуправление
Это компьютерная технология, в основе которой лежит адаптивная биологическая обратная связь. Представьте, что у вас что-то болит, а описать конкретно не получается. Вас не понимают -> недуг не вылечен. Биуоправление решает эту проблему.
Что может быть лучше? Связка с искусственным интеллектом:
- С помощью биоуправления ИИ узнает всё о здоровье пациента.
- Далее Pluribus узнает о методах лечения.
- Проанализирует, смоделирует ходы. «Когда человеку станет хорошо», «в каком случае он может умереть» и т.д.
- Выдаст рекомендации по лечению и приему лекарств.
Будущее
Проект Pluribus в любом случае успешен. Ведь методы обучения дали плоды.
Пуруш Айер, доктор и один из создателей алгоритма, подчеркнул преимущество программы:
Покер – показательный пример того, как математические модели искусственного интеллекта могут решать проблемы. Наша модель не просто делает шаги поэтапно – она разрабатывает стратегию.
К тому же, Pluribus умеет подбирать стратегию для той задачи, в которой известны не все данные. Это и отличает его от аналогов.