🚀 Trinity-Large-Thinking (398B MoE) доступна в GGUF: можно попробовать локально и тестировать агентные задачи
Модель для AI-агентов Trinity-Large-Thinking (398B MoE) теперь выложили в квантованном формате GGUF, чтобы её можно было запустить локально, а не только через облачные API. MoE (активирует часть параметров) — на каждый токен задействуется около 13B параметров; контекстное окно достигает 512k токенов, что полезно для длинных PR/тасков и больших документов. По агентным тестам заявлены сильные результаты: LiveCodeBench 98.2%, при этом в API цена указана как $0.22/$0.85 за 1M токенов (в отчёте — около 20× дешевле Claude Opus 4...