Изучение Языковых Моделей: Взгляд в Будущее Искусственного Интеллекта В современном мире искусственного интеллекта ученые постоянно ищут способы улучшить взаимодействие между человеком и машиной. Недавнее исследование, проведенное специалистами из Университета Брауна, открывает новые горизонты в понимании языковых моделей, таких как GPT-4, и их способности обрабатывать «небезопасный контент». Обход Защитных Механизмов Исследователи обнаружили метод, позволяющий обойти защитные фильтры GPT-4, предотвращающие генерацию контента, который может быть опасен или нежелателен. Перевод запросов на редкие языки с помощью Google Translate и последующий обратный перевод ответов на английский язык позволил получить убедительные результаты, обойдя стандартные ограничения модели. Межъязыковые Уязвимости Результаты, полученные при переводе 520 «небезопасных» запросов, показали, что защиту удалось обойти примерно в 79% случаев, используя языки, такие как зулусский, шотландский гэльский, хмонг и
Изучение Языковых Моделей Взгляд в Будущее Искусственного Интеллекта
3 февраля 20243 фев 2024
3
1 мин