65 подписчиков
Глянул комментарии на Редите. Это мрак. ИИ написал нормальный рецепт, который с небольшой вероятностью при несоблюдении режимов приготовления и хранения продуктов могут привести к заболеванию. А люди делятся максимально вредными и эффективными советами. Особенно мне понравился этот:
•
Отредактировано 7 дней назад
Для этого вам не нужен быстрый инжиниринг.
Возьмите технику абляции выравнивания, но вместо обнуления направления вектора, связанного с отсечкой неэтичных вопросов, умножьте все веса, связанные с этим направлением, на -1.
Теперь перенастроенная модель будет либо отвечать на неэтичные вопросы, отказываясь отвечать на этические вопросы; или, что еще лучше, давать максимально неэтичные ответы на этические вопросы. Вы только что создали злого джинна-оракула!
В переводе на человеческий, человек поделился самым простым способом сделать максимально опасную и злую модель из существующей этичной.
Около минуты
26 июня 2024