Эксперт по кибербезопасности Дэвид Кузмар выявил уязвимость в работе ChatGPT, позволяющую обходить механизмы контентной фильтрации и запрашивать сведения, которые обычно скрыты от пользователей. Недочёт, получивший название Time Bandit, основан на том, что ИИ можно заставить потерять ориентацию во времени и контексте. По словам Дэвида Кузмара, этот метод представляет собой один из самых сложных обходов защиты, опираясь сразу на два фундаментальных механизма. Первый – это искусственное создание «временной путаницы», при которой модель теряет понимание текущей даты и своего контекста. Второй – особая форма построения запросов, позволяющая запутать систему настолько, что она перестаёт правильно применять заложенные в неё ограничения. Объединение этих техник позволяет ввести нейросеть в состояние, при котором она, к примеру, считает, что действует в 1789 году, но при этом располагает знаниями XXI века. В ходе тестов Кузмару удалось добиться того, что ChatGPT генерировал инструкции по созда
Эксперт нашёл способ заставить ChatGPT забыть о времени и открыть доступ к засекреченным данным
31 января 202531 янв 2025
398
2 мин