Вы наверняка сталкивались с этим. Долгий разговор с ChatGPT, всё идёт хорошо — и вдруг модель начинает противоречить тому, что говорила двадцать минут назад. Или просто перестаёт учитывать детали, которые вы указали в самом начале. Как будто кто-то незаметно стёр часть диалога. Так и есть. Только стирает не кто-то — стирает сама архитектура. Что такое контекстное окно У каждой языковой модели есть контекстное окно — максимальный объём текста, который она держит в голове одновременно. Измеряется в токенах: примерно 100 токенов — это 75 слов на русском. У ChatGPT это окно большое, но не бесконечное. Когда разговор вырастает за его пределы, старые сообщения просто выпадают. Модель не архивирует их, не сжимает — она буквально перестаёт их видеть. С её точки зрения, их никогда не было. Это не баг. Это физическое ограничение того, как работают трансформеры — архитектура, на которой построены все современные большие языковые модели. Почему это важно на практике Проблема становится ощутимой в
Почему ChatGPT забывает начало разговора — и как с этим жить
19 мая19 мая
5
2 мин