42 подписчика

ПРОМТЫ И КОНТЕКСТ

10 февраля10 фев

1 мин

Пост по Федеративному обучению Пост 1 из цикла Пост 2 из цикла ➖➖➖➖➖➖➖➖➖➖➖ ПРОМТЫ И КОНТЕКСТ Модель не учится, но утечка ПДн происходит легко 🤒 Сценарий знакомый всем: Сотрудник вставляет в чат-бота: “Вот переписка с клиентом / договор / жалоба / паспортные данные. Помоги ответить”. Технически модель может не обучаться на вашем тексте. Но юридически вы все равно: 👉 передали ПДн третьему лицу (провайдеру сервиса), если он внешний 👉 создали риск трансгранички/локализации (в зависимости от размещения инфраструктуры) 👉 оставили следы в журналах/телеметрии/истории запросов Почему это часто хуже, чем кажется: ⚫️ вы не контролируете, где и как хранится история запросов ⚫️ вы не контролируете, кто имеет доступ к логам (внутри провайдера/подрядчиков) ⚫️ вы не можете гарантировать, что куски текста не попадут в отладочные наборы, систему качества, антифрод, мониторинг злоупотреблений Мини-правовой ориентир для бизнеса: ❗️согласие на “использование ПДн для обучения ИИ” — это одно ❗️“передача

Пост по Федеративному обучению

Пост 1 из цикла

Пост 2 из цикла

➖➖➖➖➖➖➖➖➖➖➖

ПРОМТЫ И КОНТЕКСТ

Модель не учится, но утечка ПДн происходит легко 🤒

Сценарий знакомый всем:

Сотрудник вставляет в чат-бота: “Вот переписка с клиентом / договор / жалоба / паспортные данные. Помоги ответить”.

Технически модель может не обучаться на вашем тексте. Но юридически вы все равно:

👉 передали ПДн третьему лицу (провайдеру сервиса), если он внешний

👉 создали риск трансгранички/локализации (в зависимости от размещения инфраструктуры)

👉 оставили следы в журналах/телеметрии/истории запросов

Почему это часто хуже, чем кажется:

⚫️ вы не контролируете, где и как хранится история запросов

⚫️ вы не контролируете, кто имеет доступ к логам (внутри провайдера/подрядчиков)

⚫️ вы не можете гарантировать, что куски текста не попадут в отладочные наборы, систему качества, антифрод, мониторинг злоупотреблений

Мини-правовой ориентир для бизнеса:

❗️согласие на “использование ПДн для обучения ИИ” — это одно

❗️“передача ПДн в сторонний сервис для обработки” — другое (и часто требует отдельного анализа оснований/поручений / уведомлений)

❗️а если в результате ИИ принимает решения, влияющие на человека (скоринг, отказ, рейтинг), помним про запрет чисто автоматизированных решений, затрагивающих права, с исключениями

ЧТО ВНЕДРИТЬ БЫСТРО (и это реально работает):

✅ внутреннее правило: какие категории данных запрещено вставлять в публичные/внешние ИИ-сервисы,

✅ шаблоны обезличивания (маскирование телефонов / почты / ID, замена на токены),

✅ корпоративные настройки: отключение хранения истории там, где это возможно,

✅ DLP-контроль для каналов, где сотрудники чаще всего перекидывают ПДн в ИИ.

Есть подход, который часто безопаснее дообучения и копипаста в чат: RAG — когда модель отвечает, опираясь на ваши документы, но не впитывает их в свои веса. Разберем, где в этой схеме живут ПДн и как это правильно оформить.