Как работает память вашего ИИ персонажа? Одни помнят все, другие - ничего

23 июня23 июн

2 мин

Знакомая ситуация: вы неделю выстраивали историю с персонажем, он знал ваше имя, помнил, что у вас кот и что вы поссорились в прошлой сцене, — а потом вдруг спрашивает «а как тебя зовут?». Будто всё стёрли. Обидно особенно тогда, когда вы остаётесь в долгом сюжете, а не просто перекидываетесь репликами. Разберём, почему так происходит на самом деле, и что отличает сервис, где персонаж действительно помнит, от того, где он забывает. Языковая модель не помнит разговор так, как человек. У неё нет ощущения «мы знакомы неделю». На каждое ваше сообщение она получает кусок недавней переписки — это называется контекстное окно — и отвечает, опираясь только на него. Окно ограничено по объёму. Его измеряют в токенах — это примерно слоги и куски слов. Как только разговор становится длиннее, чем помещается в окно, самые старые сообщения буквально выпадают из поля зрения модели. Она не «решила забыть» — она их просто больше не видит. Отсюда и «а как тебя зовут»: имя осталось в начале диалога, которо

Оглавление

Главное: модель видит только «окно»
Почему «он же помнил вчера»
Как это чинят

Разберём, почему так происходит на самом деле, и что отличает сервис, где персонаж действительно помнит, от того, где он забывает.

Главное: модель видит только «окно»

Языковая модель не помнит разговор так, как человек. У неё нет ощущения «мы знакомы неделю». На каждое ваше сообщение она получает кусок недавней переписки — это называется контекстное окно — и отвечает, опираясь только на него.

Окно ограничено по объёму. Его измеряют в токенах — это примерно слоги и куски слов. Как только разговор становится длиннее, чем помещается в окно, самые старые сообщения буквально выпадают из поля зрения модели. Она не «решила забыть» — она их просто больше не видит. Отсюда и «а как тебя зовут»: имя осталось в начале диалога, которое уже вышло за край окна.

Поэтому короткие чаты почти не страдают от забывания, а длинные истории — страдают сильнее всего. Чем дольше вы общаетесь, тем больше ценного уезжает за пределы окна.

Почему «он же помнил вчера»

Тут вторая ловушка восприятия. Если вчера персонаж помнил вашего кота, это не значит, что факт записан где-то навсегда. Скорее всего, он просто всё ещё был в пределах окна. Сегодня вы написали ещё двести реплик — кот уехал за край, и его не стало.

То есть без отдельной системы памяти «помнит» и «не помнит» — это вопрос не доброй воли персонажа, а того, поместилась ли информация в окно прямо сейчас.

Как это чинят

Хорошие сервисы добавляют поверх модели отдельный слой памяти. Принцип такой.

Сжатие старого. Длинная история периодически сворачивается в краткую выжимку: кто вы, что важного произошло, какие у вас отношения. Сама переписка уезжает, а её суть остаётся в компактном виде и продолжает попадать в окно.

Вытаскивание нужного. Когда вы упоминаете что-то из прошлого, система находит относящийся к этому факт и подкладывает его модели в текущий контекст — даже если сам разговор был сто сообщений назад.

Постоянный профиль. Ключевые вещи — имя, важные детали, договорённости — хранятся отдельно и не зависят от того, влезли они в окно или нет.

Именно эта надстройка превращает «модель, которая видит окно» в «персонажа, который вас помнит».

Что можно сделать самому

Пара приёмов, которые помогают в любом сервисе.

Важные факты лучше проговаривать явно и периодически — так они с большей вероятностью попадут в выжимку. Ключевые повороты сюжета стоит фиксировать репликой, а не подразумевать. И если сервис даёт настроить описание персонажа или заметки о вас — это самое надёжное место для того, что персонаж должен помнить всегда.

Но всё это — костыли. По-хорошему память должна быть на стороне сервиса, а не на вашей.

Где память работает из коробки

В HoneyChat.bot память персонажа встроена: бот удерживает контекст разговора — имена, детали, прошлые сцены — и не сбрасывает историю на ровном месте. Для долгих сюжетов это важнее, чем что-либо ещё, потому что пропадает то самое ощущение «меня снова забыли». Плюс модель Grok 4.20 отвечает живо, а не шаблонно, так что персонаж не только помнит, но и реагирует естественно.

Попробовать можно без регистрации, с бесплатными сообщениями на старте — как раз хватит, чтобы проверить, держит ли персонаж нить разговора.