217 подписчиков

Код, которому не нужно доверять — он сам себя проверяет

17 марта17 мар

3 мин

Представь: ты пишешь код, запускаешь — и вместо тестов получаешь… математическое доказательство, что он корректен. Не «вроде работает», не «прошёл CI», а именно строго доказан. И теперь это не теория. Mistral AI выпустила Leanstral — ИИ-агента, который не просто генерирует код, а доказывает его правильность в системе Lean 4. И вот тут начинается самое интересное. Если упростить: Leanstral — это связка двух миров: Обычно LLM пишут код так: «Похоже на правильный — запускай и проверяй» Leanstral работает иначе: «Вот код. И вот доказательство, что он соответствует спецификации» И это ключевая разница. Lean — это не язык программирования в привычном смысле. Это среда формальных доказательств, где: Leanstral использует это как «идеальный валидатор». ⚙️ ИИ генерирует код + формальные утверждения

⚙️ Lean проверяет доказательство (строго, без эвристик)

⚙️ Если не сходится — модель пробует снова

⚙️ Результат: корректный код по определению Это похоже на CI/CD, но на стероидах: не тестируем → дока

⚙️ Lean проверяет доказательство (строго, без эвристик)

⚙️ Если не сходится — модель пробует снова

⚙️ Результат: корректный код по определению Это похоже на CI/CD, но на стероидах: не тестируем → дока

Оглавление

🧠 Что вообще произошло (и почему это не просто очередная модель)
⚙️ Как это работает под капотом
⚙️ Архитектура идеи

Представь: ты пишешь код, запускаешь — и вместо тестов получаешь… математическое доказательство, что он корректен. Не «вроде работает», не «прошёл CI», а именно строго доказан.

И теперь это не теория. Mistral AI выпустила Leanstral — ИИ-агента, который не просто генерирует код, а доказывает его правильность в системе Lean 4.

И вот тут начинается самое интересное.

🧠 Что вообще произошло (и почему это не просто очередная модель)

Если упростить: Leanstral — это связка двух миров:

генеративный ИИ
формальная математика (proof assistants)

Обычно LLM пишут код так:

«Похоже на правильный — запускай и проверяй»

Leanstral работает иначе:

«Вот код. И вот доказательство, что он соответствует спецификации»

И это ключевая разница.

⚙️ Как это работает под капотом

Lean — это не язык программирования в привычном смысле. Это среда формальных доказательств, где:

код = математический объект
поведение = теорема
выполнение = доказательство

Leanstral использует это как «идеальный валидатор».

⚙️ Архитектура идеи

⚙️ ИИ генерирует код + формальные утверждения
⚙️ Lean проверяет доказательство (строго, без эвристик)
⚙️ Если не сходится — модель пробует снова
⚙️ Результат: корректный код по определению

Это похоже на CI/CD, но на стероидах:

не тестируем → доказываем

⚙️ Почему модель маленькая, но мощная

Leanstral — всего ~6B активных параметров.

Но:

⚙️ использует разреженную (sparse) архитектуру
⚙️ заточен под задачи формальной верификации и доказательств
⚙️ работает в связке с Lean как «внешним мозгом»

Это важный тренд:

🔥 не больше модель → умнее система

📈 Разнос по эффективности (и это неожиданно)

Самое удивительное — цифры.

📈 Leanstral обгоняет open-source модели в сотни миллиардов параметров
📈 достигает лучших результатов за меньшее число попыток (pass@N)
📈 стоит в десятки раз дешевле закрытых моделей

Пример:

Sonnet — ~$549
Opus — ~$1650
Leanstral — ~$36

И при этом:

даёт сопоставимые или лучшие результаты в задачах доказательства

🧩 Реальные кейсы: не игрушка, а инструмент

Самое крутое — это не бенчмарки, а практические сценарии.

🔧 Починка сломанного кода в Lean

Lean обновился → код перестал компилироваться.

Обычный сценарий:

читаешь ошибки
гуглишь
тратишь часы

Leanstral:

🧠 воспроизводит баг
🧠 анализирует семантику (def vs abbrev)
🧠 находит причину
🧠 предлагает исправление
🧠 объясняет почему

Это уже не автокомплит. Фактически — как разработчик среднего уровня с опытом.

🧠 Работа с программами как с математикой

Leanstral умеет:

⚙️ переводить код между формальными системами (например, Rocq → Lean)
⚙️ описывать поведение программы как теорему
⚙️ доказывать свойства (например: «эта функция увеличивает X на 2»)

Это звучит абстрактно, но на практике это значит:

можно доказать, что код делает именно то, что должен

🚀 Почему это реально меняет индустрию

Сегодня узкое место в AI-кодинге — не генерация, а проверка.

Ты пишешь через LLM → потом:

ревью
тесты
багфиксы
ещё ревью

Leanstral убирает этот слой:

📌 сначала доказательство → потом код

💡 Где это особенно критично

📊 Финансовые системы (ошибка = деньги)
🚀 Аэрокосмика (ошибка = катастрофа)
🔐 Криптография (ошибка = взлом)
📚 Математика (ошибка = ложное утверждение)

Там, где «примерно правильно» не работает.

🧘‍♂️ Мой взгляд: это начало новой парадигмы

Честно — это один из самых недооценённых релизов.

Почему?

Потому что большинство смотрит на AI как на:

«генератор кода»

А здесь появляется новый класс:

генератор доказуемых систем

🔮 Что будет дальше

📈 Появятся IDE с встроенными доказательствами
📈 CI эволюционирует в проверку через формальные доказательства
📈 появятся пайплайны разработки, основанные на доказательствах корректности
📈 LLM будут писать спецификации, а не код

И, возможно, через несколько лет:

писать код без доказательства будет считаться плохой практикой

⚠️ Но не всё так идеально

Давай без хайпа.

⚠️ Lean — сложная система (входной порог высокий)
⚠️ не все задачи можно формализовать
⚠️ доказательства могут быть громоздкими
⚠️ инструменты пока на ранней стадии развития

И главное:

это пока не для обычного веб-разработчика

🧾 Итог

Leanstral — это не про «ещё один Copilot».

Это шаг к миру, где:

код = математика
баги = логические ошибки
разработка = доказательство

И если раньше мы писали код и надеялись, что он работает…

то теперь появляется альтернатива:

писать код, который гарантированно работает