11 тыс подписчиков
🚀 Релиз LongCat-Flash-Prover - это одна из самых сильных open-source моделей для формальной математики.
Модель строит и проверяет доказательства как в реальной математике.
Внутри
• 🧠 Не один агент, а гибрид экспертов - модель генерирует и отбирает лучшие цепочки рассуждений
• ⚙️ Алгоритм HisPO - держит длинную логику без развала
• 🔍 Жесткая проверка:
- Lean4 (формальная математика)
- AST-анализ
- проверка корректности
→ галлюцинации почти убраны
📊 Результаты:
• 97.1% на MiniF2F (всего 72 попытки)
• 41.5% на PutnamBench (очень сложные задачи)
Это уже уровень, где open-source начинает догонять топовые research-модели.
🤗 Hugging Face: https://huggingface.co/meituan-longcat/LongCat-Flash-Prover
Около минуты
Вчера