27 подписчиков

Anthropic разрешила своему ИИ Claude самостоятельно прерывать разговор с человеком, если он несёт опасные или оскорбительные интонации

18 августа 202518 авг 2025

~1 мин

Anthropic разрешила своему ИИ Claude самостоятельно прерывать разговор с человеком, если он несёт опасные или оскорбительные интонации. Например, если это касается контента сексуального характера с участием детей, информации для массового насилия и терроризма. Причём это делается не для защиты человека, а для "благополучия" самой модели, которая, впрочем, не обладает сознанием и не может быть реально травмирована. Однако компания уже сейчас внедряет меры, на случай, если подобное благополучие окажется возможным.

Причём это делается не для защиты человека, а для "благополучия" самой модели, которая, впрочем, не обладает сознанием и не может быть реально травмирована. Однако компания уже сейчас внедряет меры, на случай, если подобное благополучие окажется возможным.