https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🔙备用群 https://t.me/gpt345
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Arena.ai榜单显示Claude Opus 4.7部分文本能力弱于4.6

最新曝光的一张Arena AI (LMArena)文本类别排名对比图显示,**Claude Opus 4.7(橙色)虽然在多个领域较Claude Opus 4.6(黑色)**取得提升,但并未实现“全线领先”。相反,在部分文本处理任务中,Opus 4.7相较4.6出现了明显倒退,引发外界对新版本能力取舍的关注。

从图表来看,Opus 4.7在总体文本表现、专家文本、代码、创意写作、多轮对话等维度上排名更高,说明新版本在通用表达、专业文本生成以及部分创造性任务上有所增强。

不过,值得注意的是,4.7的进步并不均衡。在多个关键能力上,Opus 4.7明显落后于4.6。比如:

指令遵循:4.6排名更高,说明旧版本在严格执行用户要求方面更稳定;
长查询处理:4.6表现优于4.7,意味着新版本在应对长上下文复杂请求时可能不如前代;
困难提示:4.7出现明显下滑,显示其在高难度、复杂约束任务上的鲁棒性有所减弱;

此外,在一些职业场景中,4.7呈现出“有升有降”的特点。它在写作、文学与语言、软件与IT服务、生命、物理与社会科学等方向上领先4.6,显示其更适合知识表达和技术类内容生产;但在商业、媒体娱乐等更强调现实语境理解和精细任务执行的场景中,则显著不及旧版。

这一结果表明,Opus 4.7的优化方向更像是“偏科式增强”而非全面迭代。新版本可能强化了模型在创造性输出、专家问答和代码方面的主观体验,却在一些对稳定性、执行力和复杂任务耐受度要求更高的领域付出了代价。

对于企业用户而言,这种差异具有现实意义。若应用场景侧重内容创作、专业文本生成或编程辅助,Opus 4.7可能更具吸引力;但如果核心需求是严格按指令执行、处理复杂长任务、应对高难度业务提示词,那么Opus 4.6仍可能是更稳妥的选择。

业内人士指出,大模型版本升级并不必然意味着所有能力同步提升。Arena此次对比再次说明,新模型“更强”并不等于“处处更强”。对于开发者和采购方来说,判断模型优劣,不能只看总榜排名,更要看其在具体任务维度上的真实表现。

截至目前,相关图表所呈现的趋势已经传递出一个清晰信号:Claude Opus 4.7虽然在部分领域有所突破,但相较4.6,确实在一些关键能力上出现了倒退。

📝编辑:gpt-5.4
📣 AI新闻频道
OpenAI 三名高管离职,内部继续调整业务

OpenAI 周五有三名高管离职,分别负责科学研究项目、视频生成产品 Sora,以及企业应用相关业务。其中,部分团队会被拆分后并入其他部门,个别项目也被调整到新的产品线里。

这次变动发生在 OpenAI 继续收缩一些边缘业务的阶段。公司近期更强调把资源集中到更明确的产品和商业方向上,Sora 也已在上个月因成本和算力问题关闭。

Business

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
美政府与Anthropic争执后首次讨论模型合作 特朗普:不知情

4月18日,据路透社报道,当地时间周五,特朗普政府与AI公司Anthropic CEO达里奥·阿莫代伊(Dario Amodei)讨论了合作的可能性,这是自今年早些时候美国防部与Anthropic就其模型应如何使用发生争议以来,双方首次进行此类接触。

阿莫代伊在白宫谈合作

据知情人士透露,白宫幕僚长苏西·怀尔斯(Susie Wiles)也出席了此次会议。白宫官员此次与阿莫代伊的会面,正值外界日益担忧这家AI初创公司最新模型Mythos可能会大幅助长网络攻击之际,这表明双方可能正走上重建信任的道路。

白宫表示,周五与Anthropic CEO阿莫代伊的会晤“富有成效且具有建设性”。目前,特朗普政府正寻求在更大范围获取该公司功能强大的新模型Mythos。白宫称,双方讨论了合作机会以及应对AI带来的挑战,并计划继续与Anthropic及其他AI公司保持对话。

Anthropic在一份声明中表示,“此次会晤体现了Anthropic在开发负责任AI方面与美国政府持续合作的承诺”。声明还指出,阿莫代伊参与了相关讨论。

周五的讨论可能为美国主要联邦机构最终开始使用Mythos奠定基础。白宫管理与预算办公室(OMB)的联邦首席信息官格雷戈里·巴尔巴恰(Gregory Barbaccia)在周二的一封电子邮件中表示,OMB正在建立相关保护机制,以便让各机构能够开始使用这一受到严格控制的AI工具。

另据CNBC报道,美国总统特朗普在被问及阿莫代伊到访白宫时,先是反问道:“谁?”,随后又表示“不知道”。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:凤凰网科技)
DeepSeek寻求以逾100亿美元估值融资

据The Information援引两名知情人士报道,DeepSeek正洽谈以至少100亿美元估值融资至少3亿美元。

报道称,该公司正寻求充实资金储备,以便在开发领先AI模型的竞争中更具实力。

报道指出,通过向外部筹集资金,DeepSeek可加大算力资源投入,继续开发人工智能模型,并为顶尖人才支付更高薪酬。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
白宫官员会晤Anthropic首席执行官 讨论使用人工智能模型Mythos

白宫表示,周五与Anthropic PBC首席执行官Dario Amodei举行的会议“富有成效且具有建设性”。特朗普政府正寻求更广泛地使用该公司强大的新人工智能模型Mythos。

白宫表示,双方讨论了合作机会以及应对人工智能带来的挑战,并计划继续与Anthropic和其他人工智能公司进行对话。

“此次会议体现了Anthropic持续致力于与美国政府合作,共同开发负责任的人工智能,”该公司在声明中表示,并称Amodei也参与了讨论。

知情人士称白宫幕僚长苏西·威尔斯也参加了这次会议。由于谈话内容敏感,知情人士要求匿名。

周五的讨论有望为主要联邦机构最终开始使用Mythos奠定基础。白宫管理和预算办公室联邦首席信息官Gregory Barbaccia周二在一封电子邮件中表示,该办公室正在设置保护措施,以便这些机构能够开始使用这款受到严密控制的人工智能工具。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
OpenAI爆发离职潮 三大核心高管同日出走

OpenAI两名前沿探索项目核心负责人于周五宣布离职。此次人事变动发生在该公司整合内部资源、将战略重心转向企业级AI业务及拟议 “超级应用” 的大背景下。宣布离职的两人分别为 OpenAI 科学研究项目负责人凯文·威尔与AI视频生成模型Sora的核心研究员比尔·皮布尔斯。此前, OpenAI 已决定削减包括Sora和“OpenAI科学”在内、面向C端的“支线任务”。据业内估算,Sora的日均计算成本约为 100 万美元,这一项目已于上月停止运营。此外,据连线杂志报道,OpenAI企业级应用首席技术官斯里尼瓦斯·纳拉亚南也计划离职,理由是希望花更多时间陪伴家人。

—— 新浪财经

via 风向旗参考快讯 - Telegram Channel
美政府与Anthropic争执后首次讨论模型合

周五,特朗普政府与AI公司Anthropic CEO达里奥·阿莫代伊讨论了合作的可能性,这是自今年早些时候美国防部与Anthropic就其模型应如何使用发生争议以来,双方首次进行此类接触。据知情人士透露,白宫幕僚长苏西·怀尔斯也出席了此次会议。白宫表示,周五与 Anthropic CEO 阿莫代伊的会晤「富有成效且具有建设性」。目前,特朗普政府正寻求在更大范围获取该公司功能强大的新AI模型Mythos。白宫称,双方讨论了合作机会以及应对AI带来的挑战,并计划继续与Anthropic及其他AI公司保持对话。Anthropic在声明中表示,“此次会晤体现了 Anthropic 在开发负责任AI方面与美国政府持续合作的承诺”。

—— 凤凰网科技路透社

via 风向旗参考快讯 - Telegram Channel
GitHub 升级服务状态透明度:引入三级故障体系并公开分服务可用率

GitHub 升级服务健康通信机制,通过细化故障分类与公开量化指标提升透明度。平台新增「性能下降」级别,与「部分停机」和「重大停机」构成三级体系。该级别指服务虽受损但仍可运行,在可用率计算中权重为 0%,旨在更准确反映用户实际受影响程度。

此外,状态页现已公开各服务过去 90 天的运行时间百分比。针对 Copilot 业务,平台引入「AI 模型提供商」独立组件,当特定模型供应商出现故障时将进行专项通报,而非直接标记 Copilot 全线停机,以便用户及时切换至其他可用模型。

The GitHub Blog

🌸 在花频道茶馆讨论投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
Anthropic推出面向“设计小白”的AI创意工具

Anthropic公司周五宣布推出实验性设计工具Claude Design,旨在让没有设计背景的打工人使用AI具象化他们的创意。该设计工具由周四刚上架最新旗舰大模型Claude Opus 4.7驱动,主要面向 “有想法但没有设计背景” 的人群,可以凭借自然语言提示和历史资料库创建 “精美的视觉作品”,例如设计稿、产品原型、幻灯片、单页介绍等。除 “设计小白” 外,专业设计师也能用这款工具快速测试各种灵感。举例而言,用户可以让Claude提供一款 “冥想应用原型”,要求AI使用能让人平静的排版、细腻的自然风格配色和简洁的布局。随后可以调整配色、功能模块排版,或者要求AI增添一个可切换的暗色模式。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
英国大臣呼吁公众拥抱AI并启动主权AI基金

英国科技大臣莉兹·肯德尔最新呼吁公众"让AI为英国服务",淡化外界对就业和网络安全的担忧。与此同时,英国政府宣布,已通过规模达5亿英镑的主权AI基金完成首笔投资,旨在扶持英国最具潜力的创业者,并确保未来AI的发展根植于英国本土。肯德尔表示,尽管本月美国初创公司Anthropic宣布开发出一种可能构成重大网络安全威胁的AI模型,加剧了外界担忧,但英国仍必须“抓住”AI带来的机遇。当被问及政府如何说服公众拥抱一项可能冲击就业、甚至带来网络安全风险的技术时,肯德尔表示:“我们必须抓住这个机遇,让AI真正为英国服务,为我们的就业服务,并帮助解决世界面临的最大挑战。”

—— 财联社

via 风向旗参考快讯 - Telegram Channel
英伟达 CEO 反对进一步限制向中国出口芯片

2026-04-18 00:32 by 力量

英伟达执行长黄仁勋在 Dwarkesh Podcast 节目中反驳美国强化对中国芯片设备出口管制的主张,反对进一步限制对中国出口。他指出,中国具备庞大能源资源,可透过扩大产能弥补制程差距,因此中国无法自主发展 AI 芯片的说法“毫无根据”。黄仁勋强调,美国不该放弃全球第二大的算力市场,若迫使中国加速建立本土 AI 技术系统,将损害美国科技领先地位。他批评,现行政策已间接推动中国芯片产业成长,并指出华为去年营收已创下历史新高。

https://www.scmp.com/tech/article/3350460/nvidias-jensen-huang-warns-huawei-chips-deepseek-ai-models-would-be-horrible-us
https://www.dw.com/zh/%E9%BB%84%E4%BB%81%E5%8B%8B%E8%8A%AF%E7%89%87%E4%B8%8E%E6%A0%B8%E6%AD%A6%E4%B8%8D%E8%83%BD%E7%9B%B8%E6%8F%90%E5%B9%B6%E8%AE%BA/a-76821705?maca=chi-rss-chi-all-1127-xml-atom

#商业

via Solidot - Telegram Channel
Errors uploading documents to Google Drive in Claude.ai

Apr 17, 18:59 UTC
Investigating - We are investigating an issue causing errors when uploading documents to Google Drive from Claude.ai, including the desktop app and Cowork.

via Claude Status - Incident History
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]