Добавить в корзинуПозвонить
Найти в Дзене

☄️OpenAI выпустили специализированную модель для детекции и маскировки персональных данных в тексте

Очень полезная штука для работы с LLM в энтерпрайзе и с клиентскими данными. Раньше для этого применяли спец софт, всякие NLP библиотечки или маленькие локальные модели. Что под капотом: ✔️ Архитектура на базе gpt-oss ✔️ 1.5B параметров всего, 50M активных ✔️ Контекстное окно 128k ✔️ Запускается в браузере или на ноутбуке Детектит 8 категорий: имена, адреса, email, телефоны, URL, даты, номера счетов и секреты (API-ключи, токены и пр.). Маскирует и потом их разворачивает обратно. У всех, кто строит AI-продукты с обработкой клиентских данных, болит одно и то же – перед отправкой в LLM-провайдера нужно вычищать перс данные, а регулярки и классический spaCy NER ловят далеко не всё. Локальная модель, которая может бегать на ноутбуке, закрывает реальную дыру – особенно для тех, кто работает в GDPR-периметре или хочет on-prem. Ссылка на модель: https://huggingface.co/openai/privacy-filter Делитесь с теми кто строит ИИ системы для бизнеса 📱 @aidivision #длябизнеса

☄️OpenAI выпустили специализированную модель для детекции и маскировки персональных данных в тексте.

Очень полезная штука для работы с LLM в энтерпрайзе и с клиентскими данными.

Раньше для этого применяли спец софт, всякие NLP библиотечки или маленькие локальные модели.

Что под капотом:

✔️ Архитектура на базе gpt-oss

✔️ 1.5B параметров всего, 50M активных

✔️ Контекстное окно 128k

✔️ Запускается в браузере или на ноутбуке

Детектит 8 категорий: имена, адреса, email, телефоны, URL, даты, номера счетов и секреты (API-ключи, токены и пр.).

Маскирует и потом их разворачивает обратно.

У всех, кто строит AI-продукты с обработкой клиентских данных, болит одно и то же – перед отправкой в LLM-провайдера нужно вычищать перс данные, а регулярки и классический spaCy NER ловят далеко не всё.

Локальная модель, которая может бегать на ноутбуке, закрывает реальную дыру – особенно для тех, кто работает в GDPR-периметре или хочет on-prem.

Ссылка на модель:

https://huggingface.co/openai/privacy-filter

Делитесь с теми кто строит ИИ системы для бизнеса

📱 @aidivision

#длябизнеса