211 подписчиков

Когда ИИ садятся за покерный стол: почему машины всё ещё плохо блефуют

11 января11 янв

2 мин

Идея звучит эффектно: посадить самые продвинутые языковые модели за покерный стол и посмотреть, кто из них не просто считает шансы, а умеет играть. Именно это сделал проект PokerBench — масштабный эксперимент, где LLM сыграли тысячи раздач в техасский холдем на реальном банкролле. Результат оказался неожиданным и, в каком-то смысле, обнадёживающим для людей: даже лучшие ИИ играют в покер слабо. В течение пяти дней девять языковых моделей сыграли почти 4000 раздач. За столом оказались GPT-5.2, Claude Sonnet 4.5, Gemini, Grok и другие. Формат — классический Texas Hold’em, где важны не только вероятности, но и психология, адаптация и долгосрочная стратегия. Формально победителем вышел o3 от OpenAI, а по таблице лидерства лучшие результаты показали Grok и GPT-5.2. Но сухие цифры скрывают главное: уровень игры всех моделей оказался далёк даже от крепкого онлайн-регуляра. Если смотреть на игру без иллюзий, сильные стороны ИИ видны сразу: 🧮 Префлоп-логика — модели уверенно оперируют стартовы

Оглавление

🃏 Что вообще произошло
🧠 В чём ИИ действительно хороши
❌ Где всё начинает ломаться

Идея звучит эффектно: посадить самые продвинутые языковые модели за покерный стол и посмотреть, кто из них не просто считает шансы, а умеет играть. Именно это сделал проект PokerBench — масштабный эксперимент, где LLM сыграли тысячи раздач в техасский холдем на реальном банкролле.

Результат оказался неожиданным и, в каком-то смысле, обнадёживающим для людей: даже лучшие ИИ играют в покер слабо.

🃏 Что вообще произошло

В течение пяти дней девять языковых моделей сыграли почти 4000 раздач. За столом оказались GPT-5.2, Claude Sonnet 4.5, Gemini, Grok и другие. Формат — классический Texas Hold’em, где важны не только вероятности, но и психология, адаптация и долгосрочная стратегия.

Формально победителем вышел o3 от OpenAI, а по таблице лидерства лучшие результаты показали Grok и GPT-5.2. Но сухие цифры скрывают главное: уровень игры всех моделей оказался далёк даже от крепкого онлайн-регуляра.

🧠 В чём ИИ действительно хороши

Если смотреть на игру без иллюзий, сильные стороны ИИ видны сразу:

🧮 Префлоп-логика — модели уверенно оперируют стартовыми руками
📊 Базовые вероятности — понимание эквити и аутов на уровне учебников
📐 Консервативные линии — минимум авантюр, максимум «по науке»
🤖 Дисциплина — никакого тильта, усталости и эмоций

На первых улицах раздачи ИИ выглядят как прилежные студенты покерной математики.

❌ Где всё начинает ломаться

Настоящие проблемы появляются дальше — там, где начинается игра против человека:

🎭 Отсутствие блефа — ИИ почти не умеют репрезентовать диапазоны
🃏 Путаница с картами — модели иногда «забывают» борд или собственную руку
📉 Плохая игра на терне и ривере — ошибки в сайзингах и таймингах
🔁 Нет адаптации — соперник может эксплуатировать их снова и снова

Фактически, ИИ играют в покер как в задачу из учебника, а не как в динамичную многоагентную систему с неполной информацией.

🔬 Почему это важнее, чем кажется

Этот эксперимент — не про покер как таковой. Он про границы современных LLM.

Покер — идеальный стресс-тест, потому что он требует:

🧠 мышления в условиях неопределённости
🎯 долгосрочной оптимизации, а не разового ответа
🪤 умения вводить в заблуждение
📚 памяти о прошлых действиях оппонента

И здесь выясняется неприятная правда: LLM отлично рассуждают, но плохо играют. Они не формируют устойчивую стратегию, а реагируют на ситуацию «здесь и сейчас».

🧩 Технический момент, о котором редко говорят

Классические покерные ИИ — вроде Libratus или Pluribus — обучались иначе:

⚙️ self-play на миллионах раздач
🧠 явные игровые состояния, а не текст
📈 оптимизация по ожидаемой прибыли, а не правдоподобию ответа

LLM же — это языковые модели. Они не «думают о выигрыше», они генерируют следующий логичный ход, и это фундаментальное ограничение.

🧑‍💻 Моё мнение

Этот турнир — отличная прививка от хайпа. Он показывает, что:

🪙 «Сильный ИИ» ≠ «хороший игрок»
🧠 Общий интеллект не равен стратегическому
🎲 Блеф — это не текст, а модель оппонента

Пока что ИИ за покерным столом — это аккуратный математик без инстинкта убийцы. И, честно говоря, как игроку мне это даже нравится.

🏁 Итог

PokerBench доказал важную вещь: мы ещё очень далеки от универсального ИИ, который одинаково хорош и в тексте, и в стратегии, и в игре против человека. И это не провал — это ценная диагностика.

Покер снова оказался зеркалом интеллекта. И в этом зеркале ИИ пока видят только карты, но не людей.

🔗 Ссылки

Проект и лидерборд PokerBench:
https://llmholdem.com/