В сентябре 2025 года команда Google AI Research и DeepMind анонсировала VaultGemma — крупнейшую в мире открытую языковую модель, полностью обученную с применением дифференциальной приватности. Это событие стало значимым шагом для всей индустрии, открыв новые горизонты в балансе между техническим прогрессом и защитой пользовательских данных. VaultGemma — 1-миллиардная параметрическая LLM — обучена алгоритмом DP-SGD, где в процессе обучения градиенты обрезаются, а затем к ним добавляется специально рассчитанный шум. Это позволяет достичь формальных гарантий приватности (ε ≤ 2.0, δ ≤ 1.1e-10) на уровне образовательных последовательностей: модель практически не способна воспроизводить или запоминать уникальные фрагменты учебных данных. Такой подход защищает от меморизационных атак, когда ИИ непреднамеренно запоминает конфиденциальную информацию. Google также впервые сформулировала и проверила масштабируемые законы обучения с дифференциальной приватностью, точно прогнозирующие, сколько вычи
VaultGemma: первая открытая LLM, которая защищает ваши данные
14 сентября 202514 сен 2025
2
2 мин