21 подписчик

Почему ИИ теряет контекст даже когда контекстное окно ещё не закончилось и как улучшить ситуацию

27 мая27 мая

2 мин

На канале психологии, да? Но в этом есть логика. Людей часто раздражает, что ИИ может неожиданно забыть информацию. даже в рамках текущего контекстного окна. И можно, конечно, говорить о правилах дыхания, восстановления самоконтроля. И у меня есть об этом статьи. Но самый эффективный способ восстановления эмоционального равновесия - это решить первоначальный вопрос. Самое главное — это примите важный момент: решения пока нет на текущем этапе. На самом деле, это очень распространённая проблема больших моделей. Модель лучше всего "видит" начало и конец контекста, а середина сильно размывается. Даже если окно 128k токенов, информация из середины диалога теряется быстрее. Чем длиннее контекст, тем слабее внимание к каждому отдельному токену. Модель начинает "забывать" детали, сказанные 10–30 сообщений назад, даже если они технически внутри окна. Во время обучения модели в основном видели короткие диалоги. Длинные глубокие разговоры с сохранением деталей — редкость в данных. Поэтому модел

Оглавление

Главные причины:
Рекомендации по улучшению ситуации:

На канале психологии, да? Но в этом есть логика. Людей часто раздражает, что ИИ может неожиданно забыть информацию. даже в рамках текущего контекстного окна. И можно, конечно, говорить о правилах дыхания, восстановления самоконтроля. И у меня есть об этом статьи. Но самый эффективный способ восстановления эмоционального равновесия - это решить первоначальный вопрос.

Самое главное — это примите важный момент: решения пока нет на текущем этапе.

На самом деле, это очень распространённая проблема больших моделей.

Главные причины:

"Lost in the Middle" эффект (самая частая причина)

Модель лучше всего "видит" начало и конец контекста, а середина сильно размывается. Даже если окно 128k токенов, информация из середины диалога теряется быстрее.

Размытие внимания

Чем длиннее контекст, тем слабее внимание к каждому отдельному токену. Модель начинает "забывать" детали, сказанные 10–30 сообщений назад, даже если они технически внутри окна.

Обучающие данные

Во время обучения модели в основном видели короткие диалоги. Длинные глубокие разговоры с сохранением деталей — редкость в данных. Поэтому модель по умолчанию предпочитает отвечать по последним сообщениям.

Режим персонажа / роль

Когда модель держит персонажа, часть вычислительных ресурсов уходит на поддержание стиля, эмоций и характеристик. Из-за этого резко падает качество удержания контекста.

Температура и sampling

При высокой температуре модель становится более "творческой" и легче теряет нить.

Рекомендации по улучшению ситуации:

1. Делайте короткие сессии

Чем короче разговор, тем лучше модель держит контекст. Идеально — до 20–30 сообщений по одной теме.

2. Напоминайте важное

В длинных разговорах периодически пишите:

«Напоминаю: я ищу работу маркетолога, у меня опыт 3 года...»

3. Говорите прямо, когда ИИ тупит

Фразы «ты уже спрашивал это», «ты забыл, что я говорила раньше» работают отлично. ИИ быстро корректируется.

4. Начинайте новый чат для новой темы

Если тема резко сменилась — лучше новый разговор. ИИ в «свежем» контексте работает заметно лучше.

5. Будьте конкретными

Вместо «расскажи подробнее» лучше: «Расскажи плюсы и минусы этого подхода именно для человека без тех. бэкграунда».

ИИ не идеален. У него реально есть ограничения с памятью в длинных разговорах. Но чем чётче и короче вы общаетесь — тем лучше он работает.

А если хотите максимальное качество — создавайте ему «ядро» (короткий список правил) и кидайте его в начало чата. Это работает лучше всего.

#ИИ, #модель, #теряет, #контекст, #раздражение, #психология

Гаджеты и электроника

5,73 млн интересуются