Найти в Дзене

Контекстная инженерия: Как Агент помнит? (Часть 3)

Продолжаем разбирать руководство Google по ИИ-Агентам (Часть 1 - Агенты, Часть 2 - Инструменты). Если первые части были про «тело» и «инструменты», то эта - про память и как сделать агента персонализированным.
Ключевое определение: ▶️ Context Engineering (Контекстная инженерия) Эволюция промпт-инжиниринга. Промпт — это статичная инструкция.
Контекстная инженерия — это процесс динамической сборки всей информации (истории, фактов, данных из базы), которая попадает в «окно внимания» модели прямо сейчас.
Mise en place (миз-ан-плас) для шеф-повара. Прежде чем готовить (генерировать ответ), нужно нарезать и разложить все ингредиенты (данные) в правильном порядке. Аналогия от Google: Это ▶️ Два кита контекста:
1. Сессия («Верстак») Контейнер для текущего разговора. Это хронологическая запись диалога «здесь и сейчас».
Контекстное окно не резиновое. Если разговор долгий, возникает «гниение контекста» (context rot) — модель начинает забывать начало или путаться. Решается через механизм "сжатия

Продолжаем разбирать руководство Google по ИИ-Агентам (Часть 1 - Агенты, Часть 2 - Инструменты). Если первые части были про «тело» и «инструменты», то эта - про память и как сделать агента персонализированным.
Ключевое определение:

▶️ Context Engineering (Контекстная инженерия)

Эволюция промпт-инжиниринга. Промпт — это статичная инструкция.
Контекстная инженерия — это процесс динамической сборки всей информации (истории, фактов, данных из базы), которая попадает в «окно внимания» модели прямо сейчас.
Mise en place
(миз-ан-плас) для шеф-повара. Прежде чем готовить (генерировать ответ), нужно нарезать и разложить все ингредиенты (данные) в правильном порядке.
Аналогия от Google: Это

▶️ Два кита контекста:
1. Сессия («Верстак»)

Контейнер для текущего разговора. Это хронологическая запись диалога «здесь и сейчас».
Контекстное окно не резиновое. Если разговор долгий, возникает «гниение контекста» (context rot) — модель начинает забывать начало или путаться. Решается через механизм "сжатия". Агент должен уметь «выжимaть» суть из старых сообщений, превращая их в краткие саммари, чтобы освободить место на верстаке.
Аналогия: Рабочий верстак. На нем лежит всё, что нужно для текущей задачи: инструменты, черновики, заметки. Это «горячая» память.
  1. Память («Картотека»)
Механизм долгосрочного хранения. Это то, что агент знает о пользователе сквозь время и разные сессии.
Основа для Персонализации. Агент помнит, что вы любите место у окна в самолете, даже если вы говорили об этом месяц назад.
Аналогия: Аккуратный архивный шкаф. Когда проект на верстаке закончен, мы не сваливаем всё в кучу, а отбираем только важное, подписываем папку и убираем в архив.

▶️ RAG vs Память: В чем разница?

Многие путают эти понятия. Google дает отличное разделение:
RAG (Библиотекарь): Знает факты о мире. Работает со статичными документами (инструкции компании). Отвечает на общие вопросы.
Память (Личный ассистент): Знает факты о ТЕБЕ. Работает с динамическими данными, которые меняются (твои планы, вкусы, история покупок).

▶️ Как рождается память: 4 этапа (LLM-driven ETL)

Память агента — это не пассивная база данных, а активный процесс.
Google описывает это как LLM-driven ETL (Extract, Transform, Load):
1️⃣
Извлечение (Extraction)
Агент слушает «шумный» диалог и вылавливает оттуда крупицы смысла. («Пользователь упомянул, что у него аллергия на орехи»).
2️⃣
Консолидация (Consolidation)
Самый сложный этап. Агент проверяет: «Я уже знаю это?».
* Если информация новая - создать запись.
* Если противоречит старой - обновить (вкусы поменялись).
* Если дубликат - игнорировать.
3️⃣
Хранение (Storage)
Запись сохраняется в векторную базу данных или граф знаний.
4️⃣
Поиск (Retrieval)
В нужный момент (и только в нужный!) агент достает это воспоминание и добавляет его в контекст.

▶️ Типы памяти:

Декларативная: «Знаю ЧТО». Факты, события, предпочтения. (Пример: «День рождения пользователя 31 января»).
Процедурная: «Знаю КАК». Навыки и алгоритмы. Агент запоминает успешные цепочки действий для решения задач, чтобы в следующий раз сработать эффективнее. Это путь к самообучающимся агентам без дообучения модели (fine-tuning)

Изучаем, запоминаем.
#матчасть

@ReymerDigital