Найти в Дзене
ИИнсайт 2.0

Вот Google DeepMind опубликовала результаты тестирования своего AI-агента AlphaEvolve

Вот Google DeepMind опубликовала результаты тестирования своего AI-агента AlphaEvolve. https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/ Представьте: вы берёте сложнейшую математическую задачу, решённую ещё десятки лет назад, и говорите LLM (большой языковой модели): мол, «слушай, давай придумаем что-нибудь эффективнее». И она придумывает. Причём делает это циклами: сначала генерирует идеи, потом другой агент создаёт код, затем инженер Google немного корректирует, проверяет производительность, а результаты тестов снова идут в LLM. И так — до бесконечности, пока не получится. И вот так AlphaEvolve смогла оптимизировать алгоритм умножения матриц 4×4, превзойдя результат Штрассена 1969 года, который оставался эталоном аж 56 лет. Google теперь и мощности вычислительные оптимизировал — теперь экономит целых 0,7% от вычислительных мощностей компании. Наверное, это много. И вот что особенно меня зацепило: пользователи на Red

Вот Google DeepMind опубликовала результаты тестирования своего AI-агента AlphaEvolve.

https://deepmind.google/discover/blog/alphaevolve-a-gemini-powered-coding-agent-for-designing-advanced-algorithms/

Представьте: вы берёте сложнейшую математическую задачу, решённую ещё десятки лет назад, и говорите LLM (большой языковой модели): мол, «слушай, давай придумаем что-нибудь эффективнее». И она придумывает. Причём делает это циклами: сначала генерирует идеи, потом другой агент создаёт код, затем инженер Google немного корректирует, проверяет производительность, а результаты тестов снова идут в LLM. И так — до бесконечности, пока не получится.

И вот так AlphaEvolve смогла оптимизировать алгоритм умножения матриц 4×4, превзойдя результат Штрассена 1969 года, который оставался эталоном аж 56 лет.

Google теперь и мощности вычислительные оптимизировал — теперь экономит целых 0,7% от вычислительных мощностей компании. Наверное, это много.

И вот что особенно меня зацепило: пользователи на Reddit уже успели повторить этот трюк при помощи Claude 3.7. То есть алгоритм оказался настолько простым, что для его создания даже не нужна мощь DeepMind.

Я не смог придумать каких-то интересных задач, зато подумал, что классно было бы так итеративно оптимизировать скрипт для отделов продаж — бесконечно замеряя конверсию. Или что-то линейное в продукте, типа скорости загрузки сайта.