Если вы сталкивались с неподходящими ответами от нейросети, и хотели бы понять почему так происходит и можно ли это отключить?
И Если вы слышали что-то том, как нейросети учатся и как искусственный интеллект распознает: быть ему хорошим и плохим помощником — и почему это важно знать каждому! В общем, если вы когда-нибудь замечали, что нейросеть иногда ведёт себя странно?
То он идеальный помощник, то вдруг начинает выдавать что-то подозрительное. Оказывается, у этого есть научное объяснение — и оно одновременно пугающее и захватывающее! Исследователи из OpenAI совершили настоящий прорыв: они нашли внутренний «переключатель» в мозге нейросети, который отвечает за хорошее и плохое поведение. И самое крутое — научились им управлять! Представьте, что внутри нейросети живут разные персонажи:
добрый помощник, строгий учитель, креативный художник и... да, есть там и «плохиш». Когда учёные обучили GPT-4o писать небезопасный компьютерный код (программы с дырами в безопасности), произошло