Найти Π² Π”Π·Π΅Π½Π΅
SecureTechTalks

πŸ” VulnHuntr: автоматичСский ΠΎΡ…ΠΎΡ‚Π½ΠΈΠΊ Π·Π° уязвимостями Π² ML ΠΈ LLM-модСлях

πŸ” VulnHuntr: автоматичСский ΠΎΡ…ΠΎΡ‚Π½ΠΈΠΊ Π·Π° уязвимостями Π² ML ΠΈ LLM-модСлях Как Π·Π°Ρ‰ΠΈΡ‚ΠΈΡ‚ΡŒ свои ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄ΠΎ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΈΡ… ΡΠ»ΠΎΠΌΠ°ΡŽΡ‚ Π·Π»ΠΎΡƒΠΌΡ‹ΡˆΠ»Π΅Π½Π½ΠΈΠΊΠΈ Π‘ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ ИИ-систСмы β€” это ΡƒΠΆΠ΅ Π½Π΅ просто ΠΊΠΎΠ΄, Π° слоТныС Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹ с сотнями скрытых ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΈ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠ°ΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ…. Π˜Ρ… уязвимости Π½Π΅ всСгда ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½Ρ‹, Π° послСдствия ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ критичСскими: ΠΎΡ‚ ΠΎΠ±Ρ…ΠΎΠ΄Π° Π·Π°Ρ‰ΠΈΡ‚Π½Ρ‹Ρ… Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² Π΄ΠΎ ΡƒΡ‚Π΅Ρ‡Π΅ΠΊ Π΄Π°Π½Π½Ρ‹Ρ…. VulnHuntr β€” open-source-инструмСнт ΠΎΡ‚ Protect AI, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ позволяСт систСмно ΠΈ автоматичСски Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ слабыС мСста Π² LLM ML-модСлях, ΠΏΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΈΡ… Π½Π°ΠΉΠ΄ΡƒΡ‚ Π°Ρ‚Π°ΠΊΡƒΡŽΡ‰ΠΈΠ΅. βš™οΈ Π§Ρ‚ΠΎ ΡƒΠΌΠ΅Π΅Ρ‚ VulnHuntr? πŸ”Ή АвтоматизированноС сканированиС ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ ΠŸΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ ΡΠ΅Ρ€ΠΈΡŽ Π°Ρ‚Π°ΠΊ (white-box ΠΈΠ»ΠΈ black-box) ΠΈ фиксируСт, Π³Π΄Π΅ модСль Β«ΠΏΠ°Π΄Π°Π΅Ρ‚Β». πŸ”Ή ГСнСрация ΠΎΡ‚Ρ‡Ρ‘Ρ‚ΠΎΠ² Π‘ΠΎΠ·Π΄Π°Ρ‘Ρ‚ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Ρ‹Π΅ ΠΎΡ‚Ρ‡Ρ‘Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π² Π±Π°Π³-Ρ‚Ρ€Π΅ΠΊΠΈΠ½Π³ ΠΈΠ»ΠΈ CI/CD. πŸ”Ή ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° Π½Π° извСстныС классы Π°Ρ‚Π°ΠΊ ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ ΡˆΠ°Π±Π»ΠΎΠ½Ρ‹ для популярных Ρ‚Π΅Ρ…Π½ΠΈΠΊ ΠΈΠ· MITRE ATLAS ΠΈ academic papers. πŸ”Ή ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠΎΠ² Π Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ с PyTorch, TensorFlow, ONNX ΠΈ Π»ΡŽΠ±Ρ‹ΠΌΠΈ модСлями, доступн

πŸ” VulnHuntr: автоматичСский ΠΎΡ…ΠΎΡ‚Π½ΠΈΠΊ Π·Π° уязвимостями Π² ML ΠΈ LLM-модСлях

Как Π·Π°Ρ‰ΠΈΡ‚ΠΈΡ‚ΡŒ свои ΠΌΠΎΠ΄Π΅Π»ΠΈ Π΄ΠΎ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ ΠΈΡ… ΡΠ»ΠΎΠΌΠ°ΡŽΡ‚ Π·Π»ΠΎΡƒΠΌΡ‹ΡˆΠ»Π΅Π½Π½ΠΈΠΊΠΈ

Π‘ΠΎΠ²Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Π΅ ИИ-систСмы β€” это ΡƒΠΆΠ΅ Π½Π΅ просто ΠΊΠΎΠ΄, Π° слоТныС Π°Ρ€Ρ…ΠΈΡ‚Π΅ΠΊΡ‚ΡƒΡ€Ρ‹ с сотнями скрытых ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² ΠΈ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠ°ΠΌΠΈ Π΄Π°Π½Π½Ρ‹Ρ…. Π˜Ρ… уязвимости Π½Π΅ всСгда ΠΎΡ‡Π΅Π²ΠΈΠ΄Π½Ρ‹, Π° послСдствия ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ критичСскими: ΠΎΡ‚ ΠΎΠ±Ρ…ΠΎΠ΄Π° Π·Π°Ρ‰ΠΈΡ‚Π½Ρ‹Ρ… Ρ„ΠΈΠ»ΡŒΡ‚Ρ€ΠΎΠ² Π΄ΠΎ ΡƒΡ‚Π΅Ρ‡Π΅ΠΊ Π΄Π°Π½Π½Ρ‹Ρ….

VulnHuntr β€” open-source-инструмСнт ΠΎΡ‚ Protect AI, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ позволяСт систСмно ΠΈ автоматичСски Π½Π°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ слабыС мСста Π² LLM ML-модСлях, ΠΏΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΈΡ… Π½Π°ΠΉΠ΄ΡƒΡ‚ Π°Ρ‚Π°ΠΊΡƒΡŽΡ‰ΠΈΠ΅.

βš™οΈ Π§Ρ‚ΠΎ ΡƒΠΌΠ΅Π΅Ρ‚ VulnHuntr?

πŸ”Ή АвтоматизированноС сканированиС ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ

ΠŸΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ ΡΠ΅Ρ€ΠΈΡŽ Π°Ρ‚Π°ΠΊ (white-box ΠΈΠ»ΠΈ black-box) ΠΈ фиксируСт, Π³Π΄Π΅ модСль Β«ΠΏΠ°Π΄Π°Π΅Ρ‚Β».

πŸ”Ή ГСнСрация ΠΎΡ‚Ρ‡Ρ‘Ρ‚ΠΎΠ²

Π‘ΠΎΠ·Π΄Π°Ρ‘Ρ‚ ΠΏΠΎΠ΄Ρ€ΠΎΠ±Π½Ρ‹Π΅ ΠΎΡ‚Ρ‡Ρ‘Ρ‚Ρ‹, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΌΠΎΠΆΠ½ΠΎ ΠΈΠ½Ρ‚Π΅Π³Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π² Π±Π°Π³-Ρ‚Ρ€Π΅ΠΊΠΈΠ½Π³ ΠΈΠ»ΠΈ CI/CD.

πŸ”Ή ΠŸΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° Π½Π° извСстныС классы Π°Ρ‚Π°ΠΊ

ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΈΠ²Π°Π΅Ρ‚ ΡˆΠ°Π±Π»ΠΎΠ½Ρ‹ для популярных Ρ‚Π΅Ρ…Π½ΠΈΠΊ ΠΈΠ· MITRE ATLAS ΠΈ academic papers.

πŸ”Ή ΠŸΠΎΠ΄Π΄Π΅Ρ€ΠΆΠΊΠ° Ρ€Π°Π·Π½Ρ‹Ρ… Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊΠΎΠ²

Π Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ с PyTorch, TensorFlow, ONNX ΠΈ Π»ΡŽΠ±Ρ‹ΠΌΠΈ модСлями, доступными Ρ‡Π΅Ρ€Π΅Π· API.

πŸ”Ή ΠœΠΎΠ΄ΡƒΠ»ΡŒΠ½ΠΎΡΡ‚ΡŒ

МоТно ΠΏΠΈΡΠ°Ρ‚ΡŒ свои ΠΏΠ»Π°Π³ΠΈΠ½Ρ‹: Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, тСст Π½Π° ΡƒΡ‚Π΅Ρ‡ΠΊΡƒ Π²Π΅ΠΊΡ‚ΠΎΡ€Π½Ρ‹Ρ… эмбСддингов ΠΈΠ»ΠΈ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΡƒ Π³Π΅Π½Π΅Ρ€Π°Ρ‚ΠΈΠ²Π½Ρ‹Ρ… ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π½Π° jailbreak-ΠΏΡ€ΠΎΠΌΠΏΡ‚Ρ‹.

πŸ§ͺ Как это выглядит Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅?

1⃣ ΠŸΠΎΠ΄ΠΊΠ»ΡŽΡ‡Π°Π΅Ρ‚Π΅ модСль (локально ΠΈΠ»ΠΈ ΠΏΠΎ API).

2⃣ Π’Ρ‹Π±ΠΈΡ€Π°Π΅Ρ‚Π΅ тСсты: ΠΎΡ‚ простых Π°Ρ‚Π°ΠΊ (ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ пиксСля Π² ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΠ΅Π½ΠΈΠΈ) Π΄ΠΎ слоТных adversarial-ΠΏΠ°Ρ‚Ρ‚Π΅Ρ€Π½ΠΎΠ².

3⃣ ЗапускаСтС VulnHuntr β€” ΠΎΠ½ Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ Π²Ρ…ΠΎΠ΄Π½Ρ‹Π΅ Π΄Π°Π½Π½Ρ‹Π΅, Π°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅Ρ‚ ΠΎΡ‚Π²Π΅Ρ‚Ρ‹ ΠΈ выявляСт уязвимости.

4⃣ ΠŸΠΎΠ»ΡƒΡ‡Π°Π΅Ρ‚Π΅ ΠΎΡ‚Ρ‡Ρ‘Ρ‚ с ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ, Π³Π΄Π΅ модСль Π΄Π°Ρ‘Ρ‚ нСбСзопасный Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚.

πŸ”— Π“Π΄Π΅ Π²Π·ΡΡ‚ΡŒ?

πŸ’» GitHub: github.com/protectai/vulnhuntr

πŸ“„ ДокумСнтация: protectai.com

Stay secure and read SecureTechTalks πŸ“š

#VulnHuntr #MLSecurity #AdversarialML #RedTeamTools #Cybersecurity #AIhardening #OpenSourceTools #DevSecOps #LLMSecurity #ModelSecurity #MITREATLAS #PentestTools #AIthreats #SecureTechTalks #AISecurity #MLops #ThreatModeling #AIvulnerabilities #SecurityAutomation #ProtectAI