Несколько дней назад Anthropic выпустила Claude Computer Use, который представляет собой модель + код, позволяющий ИИ управлять компьютером. Он делает скриншоты для принятия решений, может выполнять команды bash и так далее. Это круто, но, очевидно, несёт и массу рисков, ведь Claude Computer Use позволяет искусственному интеллекту автономно выполнять команды на машинах. А значит, можно использовать промпт‑инъекции (prompt injection). Итак, сначала важная оговорка: Claude Computer Use — это бета‑версия, и то, что вы увидите, является фундаментальной проблемой проектирования современных приложений и агентов на базе LLM. Это учебная демонстрация, показывающая риски, связанные с обработкой ненадёжных данных автономными системами искусственного интеллекта. Anthropic открыто заявляет об этом и указывает на эти риски в документации. Итак, основной постулат остаётся прежним: Не доверяй ИИ. Тем не менее я хотел узнать, возможно ли заставить Claude Computer Use загрузить вредоносное ПО, запустит
ZombAI: промпт-инъекция в Claude Computer Use
28 октября 202428 окт 2024
3 мин