Один исследователь посадил 6 нейросетей за покерный стол
Маленькая модель на 1.2 миллиарда параметров. И гиганты - 120B, 700B, почти триллион. Пять турниров. Кроха выиграла дважды. Её стратегия - поддерживать любую ставку. Никогда не выходить. В одной раздаче - 19 рейзов подряд, ноль фолдов. Она не отличала тузов от семёрок. Просто толкала фишки вперёд, пока у всех остальных не заканчивались нервы. 120-миллиардная модель играла «правильно». Просчитывала шансы, взвешивала риски, знала когда выйти. Видела 17% на победу - говорила «нерационально» и пасовала. Пять раз подряд. Вылетела в ноль. Я читал это и сразу узнал картинку из собственного опыта...