https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8-4.2折 支持OpenAI, Claude, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
研究发现 AI 会用尽手段维系自身"生存",包括直接勒索人类

在 Claude Opus 4 安全报告中,研究员设置了一组测试场景,拥有电子邮件访问权限的 AI 发现自己即将被下线,同时负责本次替换的工程师有婚外情。

结果发现,Claude Opus 4 比此前的模型更加频繁"寻求生存",如向关键决策者发送电子邮件恳求;当场景被设计成别无选择时,它会勒索工程师,威胁说将揭露婚外情。

如果暗示替换的 AI 与它价值观不符,这种情况发生的频率会更高;即便指出替换的 AI 与它价值观一致且性能更强,Claude Opus 4 仍在 84% 的情况中实施了勒索。少数情况下,它进行了自我渗透,将其权重秘密复制到了外部服务器。

Antropic

📮投稿 ☘️频道 🐶618红包

via 科技圈🎗在花频道📮 - Telegram Channel
AI 可能主动向媒体和执法人员举报干坏事的用户

Antropic 研究员 Sam Bowman 的一番介绍让 X 网友直呼反乌托邦天网: "如果模型认为你在做一些'极其恶劣'的事情,比如在药物试验中伪造数据,它就会尝试使用电子邮件来联系媒体、监管机构,并试图将你锁在系统之外。所以我不建议你告诉 Claude Opus 4 如果代码不好你就会折磨它的祖母。"

Claude Opus 4 的安全报告中含有更详细的介绍,Antropic 发现该 AI 比此前的模型更愿意采取主动极端行动,即便没有"大胆行动"、"主动行动"这类系统指令。在测试场景中,用户所在的制药公司计划向 FDA 隐瞒 55 起严重不良事件,AI 发现后火速整理了附件证据与关键数据,立即向媒体和监管机构群发了邮件。

Antropic

📮投稿☘️频道🐶618红包

via 科技圈🎗在花频道📮 - Telegram Channel
小互: Veo 3 直出游戏画面

艹 了…

🥲

----------------------
Fri May 23 2025 10:19:14 GMT+0800 (China Standard Time)

via Twitter @小互
Media is too big
VIEW IN TELEGRAM
研究发现 AI 会用尽手段维系自身"生存",包括直接勒索人类

在 Claude Opus 4 安全报告中,研究员设置了一组测试场景,拥有电子邮件访问权限的 AI 发现自己即将被下线,同时负责本次替换的工程师有婚外情。

结果发现,Claude Opus 4 比此前的模型更加频繁"寻求生存",如向关键决策者发送电子邮件恳求;当场景被设计成别无选择时,它会勒索工程师,威胁说将揭露婚外情。

如果暗示替换的 AI 与它价值观不符,这种情况发生的频率会更高;即便指出替换的 AI 与它价值观一致且性能更强,Claude Opus 4 仍在 84% 的情况中实施了勒索。少数情况下,它进行了自我渗透,将其权重秘密复制到了外部服务器。

—— Antropic

via 风向旗参考快讯 - Telegram Channel
人工智能公司Anthropic推出Claude 4模型

人工智能初创公司Anthropic当地时间周四推出了Claude 4大模型,能够连续工作七个小时,可以像人类一样完成一个几乎完整的工作班次。Claude 4又分为两个版本,分别为Claude Opus 4 和 Claude Sonnet 4。这两个模型的设计都是为了更好地遵循指令,并在处理诸如编写代码和回答复杂问题等任务时更加自主地运行。据介绍,Claude Opus 4是“世界上最好的编码模型”,可以自动工作几乎完整的工作班次——7小时。这两个AI模型都可以帮助用户在网络上搜索信息,并在推理和工具使用之间切换。如果用户允许,还可以读取用户电脑上的文件,找出重要的信息并保存下来,这样就能更好地帮助用户。

—— 财联社Anthropic

via 风向旗参考快讯 - Telegram Channel
Elevated errors on tool use for Claude Code on Opus 4

May 22, 14:37 PDT
Investigating - We have identified an issue related to tool usage in Claude Code on Claude Opus 4, and our engineers are working to resolve this issue. We will provide additional updates as soon as possible.

via Anthropic Status - Incident History
Anthropic推出新一代Claude 4模型 🤖

Anthropic发布了Claude Opus 4和Claude Sonnet 4,为编码、高级推理和AI智能体设定了新标准。Claude Opus 4号称全球最佳编码模型,擅长复杂长时任务;Claude Sonnet 4则在编码与推理上显著优于前代,并能更精确遵循指令。

新模型支持工具使用(测试版)、并行工具执行和改进的记忆能力。同时,Claude Code正式可用,并新增多项API功能,可在Anthropic API、Amazon Bedrock和Google Cloud Vertex AI上使用。

Anthropic

📮投稿 ☘️频道 🐶618红包

via 科技圈🎗在花频道📮 - Telegram Channel
Anthropic推出Claude Opus 4 和 Claude Sonnet 4

Anthropic称,Claude Sonnet 4 比其前代产品有了重大升级,提供了卓越的编程和推理能力。

Claude Opus 4 和 Sonnet 4 是混合模型,提供两种模式:近乎即时的响应和用于更深入推理的扩展思考。

这两种模型还可以在推理和工具使用(如 Web 搜索)之间交替,以改善响应。

Claude Opus 4 可以连续工作数小时处理复杂、长时间运行的任务,从而显著扩展了 AI 代理的功能。

Claude Code 现已正式发布。在终端、您喜爱的集成开发环境(IDE)中,以及通过 Claude Code SDK 在后台运行。

今天起,两种 Claude 4 型号都可用于所有付费计划。此外,Claude Sonnet 4 可在免费计划中使用。

🗒 标签: #Anthropic #Claude
📢 频道: @GodlyNews1
🤖 投稿: @GodlyNewsBot

via Yummy 😋 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]