Найти в Дзене

ДООБУЧЕНИЕ (fine-tuning) и LoRA

Пост по Федеративному обучению Пост 1 из цикла ➖➖➖➖➖➖➖➖➖➖➖ ДООБУЧЕНИЕ (fine-tuning) и LoRA Вы не храните датасет, но обязанности по ПДн никуда не делись 👀 Есть базовая модель (например, языковая). Вы даете ей набор своих примеров: диалоги, письма, карточки обращений, шаблоны ответов и получаете модель, которая лучше говорит “как вы”. Две популярные формы: ⚫️ Fine-tuning — полноценная настройка весов модели; ⚫️ LoRA/PEFT — «легкие адаптеры» (часто проще внедрять и откатывать, но юридически это все равно обучение на данных). ГЛАВНАЯ ОШИБКА БИЗНЕСА “Мы же не выгружаем базу клиентов целиком, мы просто дообучили модель на примерах.” Если в этих примерах есть ПДн, это все равно обработка ПДн и нужен нормальный режим легальности/безопасности. Ключевые ПДн-риски fine-tuning: 👉 Утечка через веса: модель может воспроизводить фрагменты обучающих данных при удачных запросах 👉 Трудно доказать обезличивание: “удалили ФИО” не значит обезличили (может остаться связность и косвенная идентификация) ?

Пост по Федеративному обучению

Пост 1 из цикла

➖➖➖➖➖➖➖➖➖➖➖

ДООБУЧЕНИЕ (fine-tuning) и LoRA

Вы не храните датасет, но обязанности по ПДн никуда не делись 👀

Есть базовая модель (например, языковая).

Вы даете ей набор своих примеров: диалоги, письма, карточки обращений, шаблоны ответов и получаете модель, которая лучше говорит “как вы”.

Две популярные формы:

⚫️ Fine-tuning — полноценная настройка весов модели;

⚫️ LoRA/PEFT — «легкие адаптеры» (часто проще внедрять и откатывать, но юридически это все равно обучение на данных).

ГЛАВНАЯ ОШИБКА БИЗНЕСА

“Мы же не выгружаем базу клиентов целиком, мы просто дообучили модель на примерах.”

Если в этих примерах есть ПДн, это все равно обработка ПДн и нужен нормальный режим легальности/безопасности.

Ключевые ПДн-риски fine-tuning:

👉 Утечка через веса: модель может воспроизводить фрагменты обучающих данных при удачных запросах

👉 Трудно доказать обезличивание: “удалили ФИО” не значит обезличили (может остаться связность и косвенная идентификация)

👉 Подрядчики/облако: если дообучение делается у внешнего провайдера, добавляются вопросы поручения обработки, контроля цепочки подрядчиков и трансгранички (если инфраструктура вне РФ)

Где правовая «вилка»:

🔷 Если обработка идет в интернете и задействуются базы данных вне РФ при сборе/записи/хранении ПДн граждан РФ, это запрещено (кроме предусмотренных законом исключений)

🔷 Если ПДн уходят за границу, отдельно оценивается трансграничная передача и действует порядок уведомления/ограничения

Практический минимум безопасного сценария:

✅ В тренировочный набор попадает только то, что прошло редактирование/маскирование (телефоны, почта, номера документов, адреса, уникальные идентификаторы)

✅ Отдельно решаем, что делаем с логами обучения и артефактами пайплайна (это классический источник утечек)

✅ На договорных условиях фиксируем роли и ответственность, если есть провайдер

✅ Технически: контроль доступа, шифрование, сегментация, журналирование

А что если модель вообще не надо обучать? Иногда самый рискованный шаг — это не fine-tuning, а обычный “скопировал/вставил клиентские данные в чат”.

Разберем разницу между обучением и простым использованием в следующих постах цикла по Федеративному обучению, либо на индивидуальной консультации, если это необходимо.