Пост по Федеративному обучению Пост 1 из цикла Пост 2 из цикла Пост 3 из цикла ➖➖➖➖➖➖➖➖➖➖➖ RAG (поиск + генерация по вашим документам) Почему это часто лучший вариант для ПДн 🤒 Идея простая: Модель сама по себе "общая". А ваши знания находятся в вашей базе. Когда пользователь задает вопрос, система: 1️⃣ Находит релевантные фрагменты (поиск/векторный поиск); 2️⃣ Подставляет их в контекст запроса; 3️⃣ Модель формирует ответ. Почему RAG снижает риск: ➖ данные не превращаются в веса модели (меньше риск воспроизведения из памяти), ➖ проще контролировать, где хранятся документы и кто к ним имеет доступ, ➖ проще управлять жизненным циклом данных (удалили документ, и знание исчезло). НО ИЛЛЮЗИИ СТРОИТЬ НЕ СТОИТ: RAG — НЕ "ВОЛШЕБНАЯ ОБЕЗЛИЧКА". ПДн могут быть: ➡️ в индексируемых документах, ➡️ в самой базе (векторное хранилище это тоже хранилище данных), ➡️ в логах запросов (кто что спрашивал часто тоже чувствительно). Риски безопасности: 🔵 утечки через неправильные права доступа к документам
RAG (поиск + генерация по вашим документам)
3 дня назад3 дня назад
1 мин