Модель хостят на инфраструктуре Cerebras, скорость — до тысячи токенов в секунду. Контекст 128к токенов, картинки не поддерживает. По бенчмаркам ~на уровне Codex-5.3-low, но намного быстрее. Кто не в курсе, Cerebras — это компания, которая создала самый большой GPU в мире — Wafer-Scale Engine (WSE): - 850 000 ядер, - 40 ГБ on‑chip SRAM, - 20 петабайт/сек пропускной способности. На нём же работает Mistral и именно поэтому эта модель такая молниеносная. 👋 Lama AI — #лама_news
✴️ OpenAI решила не отставать от гугла и вытащила своего туза — GPT-5.3-Codex-Spark
12 февраля12 фев
~1 мин