Очень полезная штука для работы с LLM в энтерпрайзе и с клиентскими данными. Раньше для этого применяли спец софт, всякие NLP библиотечки или маленькие локальные модели. Что под капотом: ✔️ Архитектура на базе gpt-oss ✔️ 1.5B параметров всего, 50M активных ✔️ Контекстное окно 128k ✔️ Запускается в браузере или на ноутбуке Детектит 8 категорий: имена, адреса, email, телефоны, URL, даты, номера счетов и секреты (API-ключи, токены и пр.). Маскирует и потом их разворачивает обратно. У всех, кто строит AI-продукты с обработкой клиентских данных, болит одно и то же – перед отправкой в LLM-провайдера нужно вычищать перс данные, а регулярки и классический spaCy NER ловят далеко не всё. Локальная модель, которая может бегать на ноутбуке, закрывает реальную дыру – особенно для тех, кто работает в GDPR-периметре или хочет on-prem. Ссылка на модель: https://huggingface.co/openai/privacy-filter Делитесь с теми кто строит ИИ системы для бизнеса 📱 @aidivision #длябизнеса
☄️OpenAI выпустили специализированную модель для детекции и маскировки персональных данных в тексте
2 дня назад2 дня назад
~1 мин