Вот три главных ресурса в применении семантических функций. Каждая задача должна требовать меньше токенов: меньше читать и писать. Цена токенов растёт квадратично относительно размера контекста: значит, выгоднее несколько раз решить малую задачу с малым контекстом, чем один раз — большую с большим. Размер контекста — ограничение принципиально другое. Сколько бы ни было денег (токенов), контекстное окно ограничено. Задача, вместе со всем решением и дополнительными материалами, не может быть больше некоторого предела. Более того, качество работы модели падает с ростом контекста: она хорошо помнит только начало и конец, середина — в тумане. Если задача не влазит в контекст, последствия — тотальная деградация качества: - контекст компактифицируется, то есть сжимается с потерями - токены на пределе дороговизны, дописываются в конец контекстного окна - новые данные не влазят, старые припоминаются неуверенно - модель движется хаотично, броуновским движением, не способная ни на целостность,