В мире искусственного интеллекта постоянно появляются новые задачи и бенчмарки, направленные на проверку способностей современных моделей. И хотя кажется, что нейросети уже легко обыгрывают людей в шахматы, Go или даже StarCraft, некоторые задачи, на первый взгляд простые для человека, превращаются в настоящее испытание даже для самых продвинутых мультимодальных моделей. Одна из таких неожиданных проблем — популярная инди-игра «Baba is You». 🧩 Что делает Baba is You таким сложным вызовом? На первый взгляд «Baba is You» выглядит забавно и даже мило: маленький персонаж Баба перемещается по уровню, толкая слова, составляющие правила игры. Но за простой графикой и минималистичным дизайном скрывается глубокий и сложный игровой процесс, который требует умения: Оказывается, эти задачи требуют от модели не просто распознавания и генерации текста, а умения мыслить нелинейно и одновременно следить за множеством взаимосвязей. ⚙️ Как превратили игру в бенчмарк «Baba is Eval»? Разработчики проекта
🎮🤖 Когда ИИ играет в игры: Почему Baba is You ставит модели в тупик?
5 июля 20255 июл 2025
1
3 мин