OpenAI разработала новый метод под названием «Иерархия инструкций» для повышения безопасности своих больших языковых моделей (LLM).3DNews

В случае конфликта между системными инструкциями и командами пользователя, модель будет отдавать наивысший приоритет именно системным инструкциям, отказываясь выполнять инъекции.3DNews

Обновление прокладывает путь к полностью автоматизированным агентам, поскольку OpenAI стремится создать «надежных цифровых помощников», что может восстановить доверие и проложить путь к более широкому внедрению ИИ, считают аналитики.Ferra

Учитывая, что OpenAI сталкивается с постоянными проблемами в области безопасности, новый метод, применённый к GPT-4o Mini, имеет большое значение для последующего подхода к разработке ИИ-моделей.3DNews

Новую ИИ-модель OpenAI научили игнорировать популярную лазейку