☄️OpenAI выпустили специализированную модель для детекции и маскировки персональных данных в тексте
Очень полезная штука для работы с LLM в энтерпрайзе и с клиентскими данными. Раньше для этого применяли спец софт, всякие NLP библиотечки или маленькие локальные модели. Что под капотом: ✔️ Архитектура на базе gpt-oss ✔️ 1.5B параметров всего, 50M активных ✔️ Контекстное окно 128k ✔️ Запускается в браузере или на ноутбуке Детектит 8 категорий: имена, адреса, email, телефоны, URL, даты, номера счетов и секреты (API-ключи, токены и пр.). Маскирует и потом их разворачивает обратно. У всех, кто строит AI-продукты с обработкой клиентских данных, болит одно и то же – перед отправкой в...