20 подписчиков

🔐 SecureBERT 2.0: ИИ который учится говорить на языке кибербезопасности

7 октября 20257 окт 2025

1 мин

🔐 SecureBERT 2.0: ИИ который учится говорить на языке кибербезопасности 🌍 Мир не останавливается ни на секунду. Сегодня аналитики разбирают фишинговую кампанию, завтра ищут уязвимость в ядре Linux, а послезавтра анализируют подозрительные логи из облака. Данных становится всё больше и они всё сложнее. 💡 Так появился SecureBERT. Это не универсальная модель, а ИИ натренированный именно на языке киберугроз. 👉 GitHub проекта 🤖 Ученик цифровых угроз SecureBERT 2.0 «рос» на реальных материалах: 📑 отчёты об APT группах 🛡️ описания CVE и багов 📰 технические блоги исследователей 💻 миллионы строк кода включая эксплойты 📊 Объем тренировочных данных: 🔹 более 13 миллиардов текстовых токенов 🔹 более 53 миллиона токенов кода Это в 13 раз больше чем у первой версии модели. 🧠 Архитектура Модель основана на ModernBERT и умеет: 📏 работать с длинными документами 🗂️ понимать структуру текста и кода 🔀 совмещать язык и программный код ⚡ обрабатывать данные быстрее и эффективнее 🔎 Ч

🌍 Мир не останавливается ни на секунду. Сегодня аналитики разбирают фишинговую кампанию, завтра ищут уязвимость в ядре Linux, а послезавтра анализируют подозрительные логи из облака. Данных становится всё больше и они всё сложнее.

💡 Так появился SecureBERT. Это не универсальная модель, а ИИ натренированный именно на языке киберугроз.

👉 GitHub проекта

🤖 Ученик цифровых угроз

SecureBERT 2.0 «рос» на реальных материалах:

📑 отчёты об APT группах

🛡️ описания CVE и багов

📰 технические блоги исследователей

💻 миллионы строк кода включая эксплойты

📊 Объем тренировочных данных:

🔹 более 13 миллиардов текстовых токенов

🔹 более 53 миллиона токенов кода

Это в 13 раз больше чем у первой версии модели.

🧠 Архитектура

Модель основана на ModernBERT и умеет:

📏 работать с длинными документами

🗂️ понимать структуру текста и кода

🔀 совмещать язык и программный код

⚡ обрабатывать данные быстрее и эффективнее

🔎 Что умеет модель?

1️⃣ Поиск информации

🔍 Находит документы с точностью до 88.8%

⏱️ Аналитики SOC экономят часы на поиске нужных данных

2️⃣ Извлечение сущностей (NER)

📌 Определяет уязвимости, индикаторы компрометации, малварь

📈 F1 score: 0.945 — почти идеальная точность

3️⃣ Поиск уязвимостей в коде

🛠️ Видит SQLi XSS переполнения буфера

⚖️ Балансирует точность и минимум ложных срабатываний

🔮 Планы на будущее

Авторы планируют:

📈 увеличить размер модели

🔗 встроить её в SIEM и SOAR

🛰️ расширить использование: от анализа логов до поиска эксплойтов

Stay secure and read SecureTechTalks 📚

#ИИ #кибербезопасность #SecureBERT #AI #SOC #DevSecOps #Cisco #угрозы #BigData #LLM