OpenAI разработала новый метод под названием «Иерархия инструкций» для повышения безопасности своих больших языковых моделей (LLM).3DNews
В случае конфликта между системными инструкциями и командами пользователя, модель будет отдавать наивысший приоритет именно системным инструкциям, отказываясь выполнять инъекции.3DNews
Обновление прокладывает путь к полностью автоматизированным агентам, поскольку OpenAI стремится создать «надежных цифровых помощников», что может восстановить доверие и проложить путь к более широкому внедрению ИИ, считают аналитики.Ferra
Учитывая, что OpenAI сталкивается с постоянными проблемами в области безопасности, новый метод, применённый к GPT-4o Mini, имеет большое значение для последующего подхода к разработке ИИ-моделей.3DNews