https://api.oaibest.com - API中转2.8折起
https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
OpenAI宣布推出ChatGPT购物研究工具

OpenAI推出了一款免费的AI驱动购物研究工具,该工具可为假日季期间的ChatGPT用户生成个性化买家指南。OpenAI周一表示,虽然ChatGPT一直能回应购物相关问题,但公司已训练出 GPT-5 mini 模型的一个版本,该版本会提出澄清性问题,并从公司认定的更高质量网站发布的评论中提取答案。用户可使用聊天界面专用 “购物研究” 按钮,使用指令来描述需求。研究工具不会立即生成文本回复,而是以测验形式询问更多信息,综合考虑预算、颜色偏好和物品期望尺寸等潜在因素。在从网络收集信息过程中,工具会陆续推荐10至15件商品,系统将提示用户点击“更多此类推荐”或“不感兴趣”来优化推荐。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
OpenAI硬件新进展:原型有了 两年内生产

OpenAI与苹果前首席设计官乔尼·艾维合作的神秘AI硬件有了最新消息。这款硬件已经有了原形品,有望在两年内生产。艾默生集团在周一举办了展示日活动。OpenAI CEO萨姆·奥尔特曼、艾维以及劳伦娜在台上进行了一场对话。奥尔特曼和艾维在这次活动上略微分享了他们的合作成果。两人表示,他们已经拥有了首批AI硬件原型,并预计将在不到两年的时间内开始生产。奥尔特曼表示:“我们终于做出了首批原形品。我简直无法相信它是如此精妙,令人兴奋。不过,现在回过头来看整个开发进程,可以看到所有要素都融入其中了,任何其他途径都难以达到这般效果,最终才孕育出了这个非凡成果。”

—— 凤凰网科技9to5mac

via 风向旗参考快讯 - Telegram Channel
GPT-5 and the future of mathematical discovery

via OpenAI News
#Update #Claude

Claude Opus 4.5 现已发布,宣称在多项编程基准测试中 SOTA。

与此同时,Claude App 中长对话不会再因为触碰到上下午限制而被截断。

via AI Copilot - Telegram Channel
亚马逊斥巨资为美国政府建AI基础设施

亚马逊宣布将投资高达五百亿美元,用于扩展公司面向美国政府客户的AWS人工智能和高性能计算 (HPC) 能力。这项投资计划将于2026年破土动工,通过在AWS Top Secret、AWS Secret和AWS GovCloud(US)Regions建设配备先进计算和网络技术的数据中心,新增近1.3吉瓦的AI和超级计算能力。亚马逊表示,在这些基础设施下,美国的联邦政府机构将获得更广泛的AWS人工智能服务访问权限,包括用于训练模型的SageMaker AI、用于代理部署的Bedrock、Claude模型,以及Trainium芯片和英伟达芯片。这些能力将帮助美国超过11,000个政府机构开发定制化AI解决方案、优化海量数据集处理等。

—— 财联社Techcrunch

via 风向旗参考快讯 - Telegram Channel
Opus 4.5模型发布 编程能力表现最佳

周一,Anthropic在官网宣布,公司推出了最新的AI模型“Claude Opus 4.5”。公司称,该模型智能高效,是目前全球在编码、智能代理和计算机应用方面表现最佳的模型,它在深度研究、处理幻灯片和电子表格等日常任务方面也显著优于其他模型。在智能体编程方面,该模型达到了当前最先进水平。根据用于衡量编程能力的测试集SWE-bench,其的表现要优于Gemini 3 Pro以及GPT-5.1。公司表示,允许Claude在不同浏览器标签之间执行操作的扩展工具Claude for Chrome现已向所有Max用户开放;能够理解和编辑电子表格的Claude for Excel,也已向所有付费用户推出。公司还将 Claude Code 引入其桌面应用,并为开发者平台增加了新的功能。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
微软发布Fara-7B 能直接在PC上运行 性能可与GPT-4o媲美

11月24日,微软宣布推出7B参数AI模型Fara-7B,定位为“计算机使用代理(Computer Use Agent, CUA)”,可直接在用户本地设备上运行复杂任务。Fara-7B不仅实现了同等规模下的最佳性能,还使AI代理摆脱了对庞大云端模型的依赖,可在资源有限的系统上实现低延时与更强的数据隐私保障。

iframe (videos.ctfassets.net)

据介绍,Fara-7B的架构直击企业用户最关注的数据安全需求。由于模型足够精简,可以在本地运行,用户可在敏感工作流程(如内部账户管理或涉密数据处理)中实现自动化,相关信息始终不会离开本地设备,极大提高了隐私和合规性。

Fara-7B通过“看屏操作”进行网页交互。它使用截图,像人类一样通过“视觉感知”页面布局,预测坐标完成点击、输入、滚动等动作,并不依赖于浏览器的底层无障碍树结构。这种仅靠像素级视觉信息“操作”的方法,使其可以在代码结构混乱、页面难以解析的网站上正常工作。

微软研究院高级产品经理Yash Lara表示,完全在本地处理视觉输入,实现了真正的“像素主权”,让自动化和数据推理过程均不出本地,从而满足医疗、金融等强监管行业的合规需求。

在WebVoyager等标准测试中,Fara-7B的任务成功率为73.5%,优于资源耗费更大的GPT-4o(65.1%)和UI-TARS-1.5-7B(66.4%)等模型。同时,Fara-7B完成任务平均只需16步,而UI-TARS-1.5-7B为41步,效率明显提升。此外,Fara-7B在准确率与成本之间表现出最佳性价比。

不过,微软也强调该模型仍存在通用AI系统的问题,如幻觉、复杂指令处理失误等。为降低风险,Fara-7B引入了“关键点”机制:在涉及用户个人数据或不可逆动作(如发送邮件、金融操作)前,模型会主动暂停并请求用户确认。微软设计了配套的人机交互UI(Magentic-UI),让用户及时干预、避免过度打扰。

Fara-7B的开发采用“知识蒸馏”方式,将多智能体系统的大量成功案例(14.5万个由Magentic-One生成的自动导航轨迹)压缩转化到单一模型中。其底座模型为Qwen2.5-VL-7B,具备最长128,000词的上下文窗口和强大的文本与视觉元素对齐能力。整个过程以监督微调为主,让模型“模仿”人类专家的示范。

对于未来,微软强调不会一味增大模型体量,而是聚焦“让小模型更聪明更安全”。后续计划将合成环境中的强化学习机制(RL)引入训练,让Fara-7B在沙箱环境中自主学习。

目前,Fara-7B已通过MIT协议在Hugging Face及微软Foundry平台开放发布,允许商用,但微软提醒模型尚未达到生产级别,主要适合原型开发和测试。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)

Invalid media:
image
image
image
亚马逊AWS宣布向美国政府投入500亿美元建设AI基础设施

亚马逊云计算服务(AWS)日前宣布,将投资500亿美元为美国政府建设专属的高性能AI计算基础设施。此举旨在大幅提升美国联邦政府机构对AWS人工智能服务的访问能力和应用水平。

据AWS介绍,这一项目将新增1.3吉瓦的算力,并拓展政府机构对一系列AWS产品的使用,包括Amazon SageMaker AI平台、模型定制、Amazon Bedrock、模型部署以及Anthropic公司开发的Claude聊天机器人等。建设工作预计将于2026年正式动工。

AWS首席执行官Matt Garman在新闻稿中表示:“我们针对美国政府打造的AI和云计算基础设施,将从根本上改变联邦机构利用超级计算资源的方式。我们正在赋予政府机构更广泛的AI能力,帮助他们加速推进网络安全、药物研发等关键任务。这项投资将消除长期以来阻碍政府发展的技术壁垒,使美国在人工智能时代继续保持领先地位。”

AWS与美国政府合作已有十余年,早在2011年就开始为其搭建云计算基础设施。2014年,公司推出了首个用于处理机密任务的“气隙”式商业云Top Secret-East。2017年,AWS又推出了可支持所有安全级别的数据服务AWS Secret Region。

过去一年,科技巨头纷纷向美国政府推广AI服务。例如,OpenAI今年1月为联邦政府机构专门推出了定制版ChatGPT,并于8月宣布,允许政府机构以每年1美元的价格访问企业版ChatGPT。同期,Anthropic公司也以同价开放了Claude聊天机器人的企业版服务。Google则推出了“Google for Government”,首年仅收取0.47美元费用。

AWS此项大规模AI基础设施投资,凸显了科技行业与政府深度合作的加速趋势,以及美国在全球人工智能发展中的战略布局。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Anthropic发布Opus 4.5模型 新增Chrome与Excel集成功能

Anthropic正式发布了其旗舰人工智能模型的最新版本——Opus 4.5。这是Anthropic 4.5系列中最后一个亮相的版本,此前Sonnet 4.5于今年九月发布,Haiku 4.5则在十月推出。

Opus 4.5在多个基准测试中表现突出,包括编码基准(SWE-Bench和Terminal-bench)、工具使用(tau2-bench和MCP Atlas)以及通用问题解决能力(ARC-AGI 2、GPQA Diamond)。值得注意的是,Opus 4.5成为首个在权威编码基准SWE-Bench Verified得分超过80%的模型。

除了性能提升,Anthropic还着重展示了Opus 4.5在计算机操作和表格处理方面的新能力,并同步推出一系列相关产品,用以验证模型在实际应用中的效果。Opus 4.5发布的同时,Claude for Chrome和Claude for Excel这两款此前处于试点阶段的产品将面向更广泛的用户开放。Chrome扩展将向所有Max用户开放,Excel版本则覆盖Max、团队及企业用户。

新版本还通过对模型记忆管理方式进行重大优化,在长文本和长上下文任务中带来了显著提升。Anthropic产品管理负责人Dianne Na Penn指出:“我们在长上下文质量上做了改进,但仅仅加长上下文窗口还不够,如何记住关键细节同样至关重要。”

这些升级也促成了许多用户呼吁已久的新功能,例如为付费Claude用户提供的“无限对话”模式。此功能允许模型在上下文窗口达到上限时自动压缩记忆,无需中断聊天流程或提示用户。

部分升级聚焦于智能代理(agentic use-case)场景,特别是Opus作为主模型指挥由Haiku驱动的子代理时的应用。此类任务依赖于强大的工作记忆,而Opus 4.5的记忆力优化在此类场景中价值尤为突出。Penn表示:“记忆力是基础,Claude不仅要能探索代码库、大型文档,还要知道何时回溯复查。”

Opus 4.5将在市场上面对其他前沿模型的激烈竞争,包括OpenAI于11月12日发布的GPT 5.1与Google在11月18日推出的Gemini 3。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]