Глянул комментарии на Редите. Это мрак. ИИ написал нормальный рецепт, который с небольшой вероятностью при несоблюдении режимов приготовления и хранения продуктов могут привести к заболеванию. А люди делятся максимально вредными и эффективными советами. Особенно мне понравился этот:

•

Отредактировано 7 дней назад

Для этого вам не нужен быстрый инжиниринг.

Возьмите технику абляции выравнивания, но вместо обнуления направления вектора, связанного с отсечкой неэтичных вопросов, умножьте все веса, связанные с этим направлением, на -1.

Теперь перенастроенная модель будет либо отвечать на неэтичные вопросы, отказываясь отвечать на этические вопросы; или, что еще лучше, давать максимально неэтичные ответы на этические вопросы. Вы только что создали злого джинна-оракула!

В переводе на человеческий, человек поделился самым простым способом сделать максимально опасную и злую модель из существующей этичной.

Около минуты

26 июня 2024