Найти в Дзене
Всё сложится...

Можно ли "заставить" ИИ работать лучше при помощи подкупа, шантажа или лести?

В мире "около ИИ" существует мнение, что если добавить угрозы или подкуп в запрос, языковая модель начнет выдавать более точные ответы. Некоторые считают, что LLM реагируют лучше, если поставить их в "стрессовую ситуацию". Недавно сооснователь Google Сергей Брин заявил, что угрозы могут повысить качество ответов нейросети. По его словам, если сказать ИИ что-то вроде: _«Я похищу тебя, если не сделаешь то, то и то»_, то модель начнет выдавать более качественные ответы. Это заявление быстро разлетелось по СМИ и соцсетям, вызвав бурные обсуждения. Одни эксперты поддержали идею, другие раскритиковали её, утверждая, что такие методы не имеют научного обоснования. На Хабре недавно появилась статья, где автор решил проверить эти предположения на практике. Он провел эксперимент, тестируя разные стили взаимодействия с моделью: угрозы, лесть, давление на жалость. Итоги оказались отличными от заявления Сергея Брина. _Спойлер_: далеко не все методы работают так, как можно было ожидать. Если

Кошечка "работает" с ChatGPT
Кошечка "работает" с ChatGPT

В мире "около ИИ" существует мнение, что если добавить угрозы или подкуп в запрос, языковая модель начнет выдавать более точные ответы. Некоторые считают, что LLM реагируют лучше, если поставить их в "стрессовую ситуацию".

Недавно сооснователь Google Сергей Брин заявил, что угрозы могут повысить качество ответов нейросети. По его словам, если сказать ИИ что-то вроде: _«Я похищу тебя, если не сделаешь то, то и то»_, то модель начнет выдавать более качественные ответы.

Это заявление быстро разлетелось по СМИ и соцсетям, вызвав бурные обсуждения. Одни эксперты поддержали идею, другие раскритиковали её, утверждая, что такие методы не имеют научного обоснования.

На Хабре недавно появилась статья, где автор решил проверить эти предположения на практике. Он провел эксперимент, тестируя разные стили взаимодействия с моделью: угрозы, лесть, давление на жалость. Итоги оказались отличными от заявления Сергея Брина.

_Спойлер_: далеко не все методы работают так, как можно было ожидать.

Если интересно, ищите статью на Хабре.

https://habr.com/ru/articles/915418/