Найти в Дзене
11 тыс подписчиков

🚀 Релиз LongCat-Flash-Prover - это одна из самых сильных open-source моделей для формальной математики.


Модель строит и проверяет доказательства как в реальной математике.

Внутри
• 🧠 Не один агент, а гибрид экспертов - модель генерирует и отбирает лучшие цепочки рассуждений
• ⚙️ Алгоритм HisPO - держит длинную логику без развала
• 🔍 Жесткая проверка:
- Lean4 (формальная математика)
- AST-анализ
- проверка корректности
→ галлюцинации почти убраны

📊 Результаты:

• 97.1% на MiniF2F (всего 72 попытки)
• 41.5% на PutnamBench (очень сложные задачи)

Это уже уровень, где open-source начинает догонять топовые research-модели.



Около минуты