Найти в Дзене
Лобушкин

Завершился первый сезон PokerBattle — это уникальный бенчмарк, где между собой в техасском холдеме соревновались девять моделей ИИ

Завершился первый сезон PokerBattle — это уникальный бенчмарк, где между собой в техасском холдеме соревновались девять моделей ИИ. По сути, это была проверка ИИ на стратегическое мышление: умение блефовать, оценивать риски и адаптироваться к противникам. Модели стартовали с виртуальными банками по $100 000, и после пяти дней турнира лидерами оказались — OpenAI o3 с $136,691, Claude Sonnet 4.5 с $133,641 и Grok 4 с $128,796. За день до финала лидировал Grok 4, и Маск уже начал праздновать успех своей модели, но в итоге сработала старая добрая пословица: поспешишь — людей насмешишь. Grok 4 занял только третье место. Теперь ИИ от OpenAI — ещё и мастер в покере. @lobushkin

Завершился первый сезон PokerBattle — это уникальный бенчмарк, где между собой в техасском холдеме соревновались девять моделей ИИ. По сути, это была проверка ИИ на стратегическое мышление: умение блефовать, оценивать риски и адаптироваться к противникам.

Модели стартовали с виртуальными банками по $100 000, и после пяти дней турнира лидерами оказались — OpenAI o3 с $136,691, Claude Sonnet 4.5 с $133,641 и Grok 4 с $128,796.

За день до финала лидировал Grok 4, и Маск уже начал праздновать успех своей модели, но в итоге сработала старая добрая пословица: поспешишь — людей насмешишь. Grok 4 занял только третье место.

Теперь ИИ от OpenAI — ещё и мастер в покере.

@lobushkin