Найти в Дзене

Кому вручать нобелевку? Искусственный интеллект улучшает математические формулы.

Вот что пишут каналы и журналюги: "Система искусственного интеллекта AlphaTensor компании DeepMind нашла ускоренный способ умножения матриц, новых решений для которых не находилось более 50 лет". Я писал курсовик на мехмате по перемножению сильно разряженных матриц и почитывал старину Гантмахера, поэтому попробую растолковать что произошло на самом деле, а заодно традиционно поумничать про ии, искуство и смыслы. Взяли версию AlphaZero, названную AlphaTensor, и обучили ее играть не в Го, а в игру под названием TensorGame. Игра представляет собой задачу на умножение матриц, которую нужно решить, и каждый ход представляет собой следующий шаг в решении этой задачи. Таким образом, серия ходов, сделанных в игре, представляет собой алгоритм перемножения этих матриц. Его награждали за победу в игре за минимальное количество ходов. В этом вся фишка! Вместо того, чтобы изучать выигрышные последовательности ходов в го или шахматах, AlphaTensor получал наилучшие последовательности шагов при умнож

Вот что пишут каналы и журналюги: "Система искусственного интеллекта AlphaTensor компании DeepMind нашла ускоренный способ умножения матриц, новых решений для которых не находилось более 50 лет".

Я писал курсовик на мехмате по перемножению сильно разряженных матриц и почитывал старину Гантмахера, поэтому попробую растолковать что произошло на самом деле, а заодно традиционно поумничать про ии, искуство и смыслы.

Взяли версию AlphaZero, названную AlphaTensor, и обучили ее играть не в Го, а в игру под названием TensorGame. Игра представляет собой задачу на умножение матриц, которую нужно решить, и каждый ход представляет собой следующий шаг в решении этой задачи. Таким образом, серия ходов, сделанных в игре, представляет собой алгоритм перемножения этих матриц.

Его награждали за победу в игре за минимальное количество ходов. В этом вся фишка!

Вместо того, чтобы изучать выигрышные последовательности ходов в го или шахматах, AlphaTensor получал наилучшие последовательности шагов при умножении матриц.

Главный результат состоит в том, что AlphaTensor открыл способ умножения двух матриц четыре на четыре, который работает быстрее, чем метод, разработанный в 1969 году немецким математиком Штрассеном, который с тех пор никто не мог улучшить. Лобовой метод для первокурсников состоит из 64 шагов, у Штрассена 49 шагов, AlphaTensor нашел способ сделать это за 47 шагов (речь идет о минимизации умножений, которые стоят дорого, в отличие от сложений, которые не стоят ничего).

Его также натравили на другие размеры матриц. Он сократил количество шагов, необходимых для умножения двух матриц 9х9, с 511 до 498, а количество шагов, необходимых для умножения двух матриц 11х11, с 919 до 896. Во некоторых других случаях AlphaTensor просто заново открыл уже ранее существовавший лучший из найденных алгоритмов.

Таким образом он не "нашел ускоренный способ умножения матриц", а открыл "новые способы умножения матриц для некоторых конкретных случаев".

И это невыносимо круто.

Это уже не оптимизация алгоритмов или вычметодов, это своего рода оптимизация мышления. ИИ дали порешать задачку, так сказать, в уме, он ее порешал, и порешал сильно "красивее", чем кожаный математик. Ибо на выходе не численная молотилка, а способ решения "на бумаге".

Я помню, что в одной из лекций Татьяна Черниговская противоречит сама себе. С одной стороны разносит ИИ за невозможность создавать что-то новое и произведения искусства в частности.

С другой стороны приводит пример с АльфаГо, которая разовала чемпиона по Го Ли Седоля как тузик грелку - в ходе партии ИИ выдавал такие ходы, от которых у проф игроков в Го случались пароксизмы экстаза. Это были реально КРАСИВЫЕ ходы. Это были произведения искусства, если угодно. Кто играл шахматы или занимался математикой, тот поймет.

Так вот, теперь ИИ демонстрирует КРАСИВЫЕ ходы в задачках перемножения матриц разных размеров. Спросите любого математика - "сократить количество шагов в 49 до 47 в новом способе - это красиво?". Ответ будет "о, да".

Потому что это именно решение математической задачи. В уме, на бумаге, силой мысли, если угодно. Причем сделано оно было в ходе интеллектуальной игры - точно также как дети или кожаные математики решают задачки - "найди лучшее решение и получишь вознаграждение". Либо конфету, либо Филдса. Обучение с подкреплением.

Сейчас любители поорать "да что он может ваш ИИ, жалкий плагиатор и повторитель" немного задумались.

И тут время совсем уж оторваться и заявить, что именно поэтому я не считаю математику наукой. Ну не подходит она под определение науки.

Математика - это искусство. Искусство красивых решений и формул.

И теперь ИИ умеет создавать НОВЫЕ произведения искусства.

источник: https://www.deepmind.com/blog/discovering-novel-algorithms-with-alphatensor