Anthropic 近日宣布,其 Claude Opus 4 和 4.1 模型已具备一项新能力,可在其消费者聊天界面中终止对话。该功能被设计为一种最后手段,仅适用于用户持续进行有害或滥用性互动,且模型多次尝试引导无效的极端情况。
Anthropic 表示,此举是其在 AI 福祉和模型对齐方面探索的一部分,且不会在用户存在自我伤害风险时使用。对话被终止后,用户无法继续当前会话,但可立即开始新聊天,或通过编辑历史消息创建新的对话分支。绝大多数用户在正常使用中不会受到影响。
Anthropic
🍀频道 🍵茶馆 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel