120 подписчиков
Google DeepMind создал модель-трансформер, которая играет в шахматы на уровне супергроссмейстера (рейтинг ЭЛО 2895), не используя традиционных алгоритмов поиска или планирования
Статья, вышла в феврале 2024 года
Ключевые моменты:
• 270.000.000 параметров, обученных на 10.000.000 шахматных партий
• всего 56 точек данных на параметр для достижения уровня гроссмейстера
• успешно решает новые шахматные головоломки, которых не видела при обучении
• работает, просто предсказывая следующий лучший ход
Почему это важно:
• демонстрирует силу обучения на больших данных без специфических для домена алгоритмов
• опровергает мнение, что языковые модели не работают с новыми данными
Открывает перспективы применения подхода в других сложных областях:
• финансовое моделирование
• научные исследования
• логистика и планирование
• медицинская диагностика
• автономное вождение
Это исследование показывает, что при достаточном количестве данных и вычислительной мощности, современные архитектуры ИИ способны решать сложнейшие задачи без специальных правил, полагаясь на "интуицию", выработанную в процессе обучения
Около минуты
18 октября 2024