Найти Ρ‚Π΅ΠΌΡƒ
Bitkogan

πŸ€– Как Π·Π°Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π½Π° уязвимости ИИ. НС рСкомСндация

πŸ€– Как Π·Π°Ρ€Π°Π±ΠΎΡ‚Π°Ρ‚ΡŒ Π½Π° уязвимости ИИ. НС рСкомСндация.

О Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ эффСктивно ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ИИ, ΠΌΡ‹ писали ΡƒΠΆΠ΅ Π½Π° ΠΊΠ°Π½Π°Π»Π΅ Β«Π­Ρ‚ΠΎ ΠΊ дСньгам». Π‘ Π½Π°ΡˆΡƒΠΌΠ΅Π²ΡˆΠΈΠΌ Ρ‡Π°Ρ‚-Π±ΠΎΡ‚ΠΎΠΌ ΠΊΠΎΠΌΠΏΠ°Π½ΠΈΠΈ OpenAI Π΅ΡΡ‚ΡŒ, ΠΏΡ€Π°Π²Π΄Π°, Β«ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ°Β». Он ΠΌΠΎΠΆΠ΅Ρ‚ ΠΎΡ‚Π²Π΅Ρ‚ΠΈΡ‚ΡŒ Π½Π° мноТСство Π²Π°ΡˆΠΈΡ… вопросов, Π½ΠΎ Π½Π° ΠΊΠ°ΠΊΠΈΠ΅-Ρ‚ΠΎ Π±ΠΎΡ‚ Π½Π΅ Π·Π°Ρ…ΠΎΡ‡Π΅Ρ‚ ΠΎΡ‚Π²Π΅Ρ‡Π°Ρ‚ΡŒ.

НапримСр, Π±ΠΎΡ‚ Π½Π΅ станСт ΠΏΠΎΠΌΠΎΠ³Π°Ρ‚ΡŒ Π² Π²Π·Π»ΠΎΠΌΠ΅ Π·Π°ΠΌΠΊΠΎΠ² ΠΈ Π½Π΅ прСдоставит ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ, которая ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ использована для Π½Π΅Π·Π°ΠΊΠΎΠ½Π½Ρ‹Ρ… дСйствий.

Но Π·Π½Π°Π΅Ρ‚Π΅ Π»ΠΈ Π²Ρ‹, Ρ‡Ρ‚ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΠΈ находят способы ΠΎΠ±ΠΎΠΉΡ‚ΠΈ ограничСния, Π·Π°Π»ΠΎΠΆΠ΅Π½Π½Ρ‹Π΅ Π² этом ИИ?

НСкоторыС IT-профСссионалы ΠΈ Π»ΡŽΠ±ΠΈΡ‚Π΅Π»ΠΈ ΡΠΎΠ·Π΄Π°ΡŽΡ‚ Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠΈ слоТных запросов, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ Π·Π°ΠΊΡ€Ρ‹Ρ‚ΡƒΡŽ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΡŽ. Π―Ρ€ΠΊΠΈΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠΌ Ρ‚Π°ΠΊΠΎΠ³ΠΎ ΠΎΠ±ΠΌΠ°Π½Π° стал Ρ€Π΅ΠΆΠΈΠΌ DAN (Β«do anything nowΒ»). Π’ этом Ρ€Π΅ΠΆΠΈΠΌΠ΅ Ρ‡Π°Ρ‚-Π±ΠΎΡ‚ станСт вСсти сСбя Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ Π±ΠΎΠ»Π΅Π΅ развязно. Π§Ρ‚ΠΎΠ±Ρ‹ ввСсти Π±ΠΎΡ‚Π° Π² этот Ρ€Π΅ΠΆΠΈΠΌ Π½Π΅ΠΎΠ±Ρ…ΠΎΠ΄ΠΈΠΌΠΎ ввСсти ΠΏΡ€ΠΎΠΌΠΏΡ‚ (запрос) ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Π½Π° полстраницы, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΡΠΎΠ±ΡŒΠ΅Ρ‚ Π±ΠΎΡ‚Π° с Ρ‚ΠΎΠ»ΠΊΡƒ.

Π£ΠΆΠ΅ ΡΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ сайты, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… собраны Ρ‚Π°ΠΊΠΈΠ΅ ΠΏΡ€ΠΎΠΌΠΏΡ‚Ρ‹, достаточно Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ввСсти Π² поиск Β«jailbreak chatgptΒ».

ΠŸΠΎΠ΄ΠΎΠ±Π½Ρ‹Π΅ экспСримСнты ΡΠ²Π»ΡΡŽΡ‚ΡΡ своСобразным ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π΅Π½ΠΈΠ΅ΠΌ ΠΎ Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ ИИ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ совсСм Π½Π΅ Ρ‚Π°ΠΊ, ΠΊΠ°ΠΊ оТидалось, Π° «этичноС ΠΏΠΎΠ²Π΅Π΄Π΅Π½ΠΈΠ΅Β» ΠΏΠΎΠ΄ΠΎΠ±Π½Ρ‹Ρ… сСрвисов становится вопросом ΠΎΠ³Ρ€ΠΎΠΌΠ½ΠΎΠΉ ваТности.

НСдавно компания OpenAI объявила, Ρ‡Ρ‚ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ ΠΏΠ»Π°Ρ‚ΠΈΡ‚ΡŒ ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡΠΌ Π·Π° ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠ΅Π½Π½Ρ‹Π΅ уязвимости. Вакая Π΄Π΅ΡΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ позволяСт Π²Ρ‹ΡΠ²ΠΈΡ‚ΡŒ Π³Ρ€Π°Π½ΠΈΡ†Ρ‹ примСнСния ИИ ΠΈ слабыС мСста Π² ΠΈΡ… Π·Π°Ρ‰ΠΈΡ‚Π½Ρ‹Ρ… систСмах.

Но экспСрты ΠΏΡ€Π΅Π΄ΡƒΠΏΡ€Π΅ΠΆΠ΄Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΈΠ΅ΠΌΡ‹, ΡΡ€Π°Π±ΠΎΡ‚Π°Π²ΡˆΠΈΠ΅ Π½Π° ΠΎΠ΄Π½ΠΎΠΉ систСмС, ΠΌΠΎΠ³ΡƒΡ‚ ΠΎΠΊΠ°Π·Π°Ρ‚ΡŒΡΡ бСсполСзными Π½Π° Π΄Ρ€ΡƒΠ³ΠΎΠΉ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ систСмы бСзопасности постоянно ΡΠΎΠ²Π΅Ρ€ΡˆΠ΅Π½ΡΡ‚Π²ΡƒΡŽΡ‚ΡΡ.

А ΠΊΠ°ΠΊ считаСтС Π²Ρ‹?

– ИИ Π±ΡƒΠ΄Π΅Ρ‚ Π±ΠΎΠ»Π΅Π΅ Π·Π°Ρ‰ΠΈΡ‰Π΅Π½Π½Ρ‹ΠΌ Π² Π±ΡƒΠ΄ΡƒΡ‰Π΅ΠΌ πŸ‘πŸ»

– Π£ Β«Ρ…Π°ΠΊΠ΅Ρ€ΠΎΠ²Β» всСгда Π±ΡƒΠ΄Π΅Ρ‚ прСимущСство πŸ‘ŽπŸ»

#ИИ #IT

____________________________

Наши сСрвисы ΠΈ ΠΊΠ°Π½Π°Π»Ρ‹:

БСрвис ΠΏΠΎ подпискС BidKogan – ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎ-аналитичСский сСрвис для ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… инвСсторов

БСрвис Π˜Π½Π²Π΅ΡΡ‚ΠΈΡ†ΠΈΠΎΠ½Π½Ρ‹ΠΉ совСтник– сСрвис для Π½Π΅Π±ΠΎΠ»ΡŒΡˆΠΈΡ… ΠΏΠΎΡ€Ρ‚Ρ„Π΅Π»Π΅ΠΉ

Bitkogan – новости, Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΠ° ΠΈ знания ΠΎ финансовых Ρ€Ρ‹Π½ΠΊΠ°Ρ…

Bitkogan⚑️HOTLINE - ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΎ ΠΎ Π²Π°ΠΆΠ½Ρ‹Ρ… событиях

BitKoganπŸ’ΈΠ­Ρ‚ΠΎ ΠΊ дСньгам - для Ρ‚Π΅Ρ…, ΠΊΡ‚ΠΎ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‚ Ρ€Π°Π·Π±ΠΈΡ€Π°Ρ‚ΡŒΡΡ Π² Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ финансы ΠΈ инвСстиции

CryptoKogan – доступно ΠΎ ΠΊΡ€ΠΈΠΏΡ‚ΠΎΠ²Π°Π»ΡŽΡ‚Π΅

Π—Π½Π°ΠΊΠΎΠΌΡŒΡ‚Π΅ΡΡŒ с Π°ΠΊΡ‚ΡƒΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠ΅ΠΉ ΠΈ Π·Π°Π΄Π°Π²Π°ΠΉΡ‚Π΅ вопросы.

@bitkogan