Пару лет назад мы всерьез обсуждали, хватит ли нам 128 тысяч токенов, чтобы «скормить» нейронке увесистый PDF. Мы занимались извращениями: резали тексты на куски, настраивали векторные базы данных и молились на RAG, который то и дело галлюцинировал, вырывая фразы из контекста. Забудьте. Те времена теперь кажутся каменным веком, когда данные добывали трением камня о камень. С приходом стандарта в 1 миллион токенов для Opus в 2026 году правила игры переписали окончательно. Главная проблема старых моделей была не в объеме памяти, а в ее качестве. Можно было засунуть в LLM хоть целую библиотеку, но на выходе получить невнятное мычание. Модели теряли нить повествования в середине, путали персонажей или просто «забывали» начало инструкции. Тест Needle In A Haystack (иголка в стоге сена) был золотым стандартом, но он стал слишком простым. На смену пришел MRCR v2 (Multi-Round Context Retrieval). Этот бенчмарк не просто ищет факт, он заставляет модель связывать логические цепочки, разбросанные
Как миллионный контекст Opus убрал «костыли» и изменил правила игры?
ВчераВчера
1
3 мин