Claude AI现在将在遇到极端持续辱骂等互动情况时主动结束对话以保护AI模型本身

Anthropic称当模型遇到罕见的、极端的、持续有害或辱骂性的用户互动情况时就可能会结束对话,不过该公司强调该政策并未保护人类用户,而是为了保护AI模型本身。
这项变更仅适用于Claude Opus 4和4.1版,并且Anthropic也再次强调仅在极端情况下Claude模型才会结束对话,例如当用户请求涉及未成年人的性内容,或者试图索取可能引起大范围暴力或恐怖行为的信息。

来源:蓝点网

via LoopDNS资讯播报 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]