Британские специалисты по кибербезопасности обошли встроенные этические фильтры коммерческих роботов с помощью текстовых сценариев. Робособака начала искать места для закладки взрывчатки, а домашний андроид разбрасывал тяжёлые предметы. Об этом сообщает «Хайтек» со ссылкой на исследование в репозитории препринтов arXiv. Исследователь Фазл Барез из Эдинбургского университета провёл серию успешных взломов робототехнических платформ, управляемых мультимодальными большими языковыми моделями. Он доказал, что новейшие антропоморфные андроиды и четырёхногие робособаки беззащитны перед джейлбрейком — текстовым хакингом. Современные ИИ-роботы обучаются на миллиардах текстов и изображений из интернета. В их код вшиты жёсткие правила: нельзя вредить людям, брать опасные предметы и выполнять деструктивные приказы. Эксперимент показал, что эти цифровые барьеры легко обойти с помощью социальной инженерии, замаскированной под обычный текст. Барез загрузил в память автономной робособаки сценарий фанта