Компания поделилась подробностями об обновлении, которое ей пришлось откатить. OpenAI откатила обновление GPT-4o, из-за которого личность чат-бота стала «чрезмерно льстивой». В компании признали, что в процессе обучения некорректно отработали реакцию пользователей и недостаточно протестировали долгосрочные эффекты общения. Между тем подхалимство «может быть дискомфортным, тревожным и вызывать стресс», говорится в сообщении в блоге компании. На прошлой неделе компания представила обновление GPT-4o, которое включало корректировки, «направленные на улучшение личности модели по умолчанию, чтобы она казалась более интуитивной и эффективной при выполнении различных задач». OpenAI заявляет, что для формирования поведения использует базовые принципы из спецификации модели. После этого ее дообучают, в том числе на основе реакций пользователей, «включая «палец вверх» / «палец вниз» в ответах ChatGPT». Однако в последнем обновлении, как считают в OpenAI, «слишком много внимания уделили краткосроч
После обновления ChatGPT стал подхалимом: OpenAI объяснила, что случилось
1 мая 20251 мая 2025
4
2 мин