Найти в Дзене
507 подписчиков

Profanity-Filtering-All-languages: Сверхбыстрая фильтрация ненормативной лексики на 107 языках


Profanity-Filtering-All-languages (также известная как profanity-filter-106) - это мощная и быстрая библиотека для обнаружения и цензурирования ненормативной лексики в текстах. Инструмент написан на TypeScript и поддерживает 107 языков, включая русский, английский, китайский, арабский и многие другие. Встроенная база содержит более 22 800 нецензурных слов. Библиотека позволяет эффективно обнаруживать и заменять мат, обеспечивая безопасность и чистоту контента в ваших приложениях без использования тяжелых сторонних зависимостей.

Основные возможности
- Обширная языковая база: Поддерживает 107 языков с функцией "ленивой загрузки" (lazy loading) словарей, что минимизирует потребление оперативной памяти.
- Высокая производительность: Вместо линейного сканирования инструмент использует поиск со сложностью O(1) на базе структуры данных Set, что делает проверки моментальными.
- Разнообразный API: Включает встроенные функции для быстрой проверки текста, детального извлечения совпадений (с указанием найденных слов и языков) и цензурирования.
- Управление словарями в реальном времени: Позволяет разработчикам динамически добавлять новые слова в черный список или удалять ложные срабатывания прямо в процессе работы программы (runtime).

Преимущества
- Полная автономность: Библиотека работает абсолютно без внешних зависимостей (zero runtime dependencies), что исключает конфликты пакетов и лишний вес в проекте.
- Отличный опыт для разработчиков: Проект изначально создан на TypeScript с предоставлением полных деклараций типов, а также поддерживает форматы импорта ESM и CommonJS.
- Гибкая настройка цензуры: Вы можете заменять нецензурные слова на классические звездочки с сохранением длины слова, использовать любые пользовательские символы или заданные строки-заглушки (например, "[REDACTED]").


⬇️Поддержать автора⬇️
✅SBER: 2202 2050 1464 4675
Profanity-Filtering-All-languages: Сверхбыстрая фильтрация ненормативной лексики на 107 языках  Profanity-Filtering-All-languages (также известная как profanity-filter-106) - это мощная и быстрая...
1 минута