На днях получили от подписчика закономерный вопрос – если компании заявляют, что их языковая модель может удерживать в памяти сразу всю „Войну и мир“, то почему ChatGPT не может написать не то что роман Толстого, но хотя бы текст на двадцать тысяч знаков? Потому что, как вы могли догадаться, подобные заявления не более чем маркетинг. Они отсылают нас к тому самому волшебному «до» в объявлении «скидки до 250%». Реальность же куда прозаичнее. Технически модели действительно могут держать в памяти «Войну и мир», контекстное окно в миллион-два токенов позволяет. Но есть нюанс: это общее количество на вход и выход. Окно быстро забивается историей чата, системными инструкциями, цепочкой рассуждений, вызовами инструментов/коннекторов, файлами и т. д. Поэтому если скопировать текст «Войны и мир» в чат и попросить переписать на языке зумеров, то на ответ уже ресурсов не останется. Именно поэтому важно каждый раз начинать новый чат. Но это в теории – на практике даже вставить текст романа в чат