8365 подписчиков

Разработан ИИ, который может выиграть любую игру, просто выучив правила.

Новый алгоритм искусственного интеллекта, разработанный исследователями из DeepMind, способен выигрывать в различных настольных играх, включая шахматы, го, покер и Скотланд-Ярд (стратегическая игра). Алгоритм, названный "Студент игр/Student of Games", сочетает в себе управляемый поиск, машинное обучение и теорию игр, что позволяет ему находить оптимальную стратегию в большинстве ситуаций.

Ранее знаменитый алгоритм AlphaZero не смог победить в покере из-за несовершенной информации, но ИИ "Student of Games" способен рассуждать на основе правил игры и принимать решения без дополнительной информации. Он использует так называемую "минимизацию контрфактического сожаления" для анализа всех возможных ходов и выбора оптимальной стратегии.

«Сожаление», означает «насколько вы могли бы добиться успеха, если бы играли оптимально, за вычетом того, насколько хорошо вы играли на самом деле». Пример: если в покере вы выиграли 200 фишек с одними картами, но могли бы выиграть 1000 с другими, сожаление оценивается в 800 фишек. Поэтому цель Student of Games — максимально уменьшить количество 800 фишек. Он учитывает все возможные варианты развития событий с открытыми картами — то есть общедоступную информацию — и усредняет их.

Все возможные сценарии сходятся к равновесию Нэша — теореме принятия решений, разработанной американским математиком Джоном Нэшем. Новый алгоритм представляет собой значительный прорыв в области искусственного интеллекта и может быть использован в различных областях, требующих принятия решений на основе неполной информации.

Разработан ИИ, который может выиграть любую игру, просто выучив правила.

1 минута

21 ноября 2023

633 читали