Похоже, рынок длинного контекста снова движется вперед. Стартап Subquadratic Представлен SubQ 1M-Preview — модель, которая обеспечивает первую кредитную компанию LLM с полностью субквадратичной архитектурой, и предоставляет для нее контекст до 12 миллионов токенов. Обычно внимание в LLM растёт слишком тяжело: чем больше контекста, тем лучше вычисления. В SubQ вместо классического сравнения «каждый токен с каждым» используется SSA — Subquadratic Sparse Attention, где модель выбирает только релевантные позиции по содержимому, а не обрабатывает всё подряд. Идея проста: не заставляйте модель «перелопачивать» весь такой текст, а дать ей более умный способ поиска роли. За счет этого разработчики обещают линейное масштабирование и более практичную работу с очень большими объемами данных. Subquadratic делает ставку не только на чат, но и на агентские скрипты. Для этого у них есть SubQ Code — CLI-агент, который может загрузить все репозитории в одном контексте, что особенно полезно для работы с