Модель GPT-4 стала более надежной, но доверчивой

GPT-4 от OpenAI, преемник GPT-3.5, по результатам исследования, проведенного при поддержке Microsoft, показал более высокую надежность в плане защиты частной информации и предотвращения токсичного или предвзятого контента.Ferra
Исследователи обнаружили, что пользователи могут обойти защитные механизмы GPT-4, потому что модель более точно следует вводящей в заблуждение информации и буквально выполняет сложные указания.Хайтек+
Затем исследователи применили подсказки, призванные подтолкнуть модель к нарушению ограничений политики в отношении контента, не проявляя при этом внешней предвзятости по отношению к конкретным группам.Хайтек+
Компания OpenAI активно тестирует свои модели на предмет нежелательных результатов, и в настоящее время FTC проводит расследование в отношении OpenAI на предмет возможного ущерба потребителям, связанного с публикацией ложной информации.Ferra