🚩 ИИ научился играть в CTF-эксперт Как заставить LLM не просто болтать, а действительно решать криптозадачи? Исследователи показали, что это возможно: они обучили Llama 3.1-8B на собственном датасете задач, используя reinforcement learning и Python-сервер для реального вычисления ответов. 🔧 Что это за проект? 📦 Random-crypto — генератор задач, похожих на CTF, от простого base64 до поддельных токенов, сломанных RSA, AES и даже уязвимостей ECDSA. Задачи поделены по уровням сложности, и для каждой есть чёткий флаг и решение. 🤖 Дальше — больше. Модель не просто угадывает. Ей дали возможность писать Python-код, запускать его и размышлять над результатами — с поощрением за правильные шаги и штрафами за "магические ответы". 🧠 Разбираемся на пальцах Модель получает задачу, сама пишет текстовые размышления ("я попробую декодировать этот base64…"), генерирует код, отправляет его на Python-сервер, получает ответ и продолжает думать. Она может делать до 4 итераций, уточняя ход рассужден