2888 подписчиков
Новость от Anthropic: расширение программы вознаграждений за обнаружение ошибок в системах безопасности моделей ИИ
Компания Anthropic объявила о расширении своей программы вознаграждений за обнаружение ошибок в системах безопасности своих моделей искусственного интеллекта.
Новая инициатива направлена на выявление уязвимостей, которые могут позволить обойти встроенные меры безопасности и этические ограничения ИИ-моделей, особенно в критически важных областях, таких как кибербезопасность и оружие (ядерное, химическое и биологическое)
Компания приглашает экспертов в области безопасности ИИ принять участие в этой программе и помочь в выявлении и устранении потенциальных уязвимостей.
Ознакомиться с оригинальной статьей можно тут
Около минуты
9 августа 2024