https://api.oaibest.com - API中转2.8折起
https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
OpenAI宣布推出ChatGPT购物研究工具

OpenAI推出了一款免费的AI驱动购物研究工具,该工具可为假日季期间的ChatGPT用户生成个性化买家指南。OpenAI周一表示,虽然ChatGPT一直能回应购物相关问题,但公司已训练出 GPT-5 mini 模型的一个版本,该版本会提出澄清性问题,并从公司认定的更高质量网站发布的评论中提取答案。用户可使用聊天界面专用 “购物研究” 按钮,使用指令来描述需求。研究工具不会立即生成文本回复,而是以测验形式询问更多信息,综合考虑预算、颜色偏好和物品期望尺寸等潜在因素。在从网络收集信息过程中,工具会陆续推荐10至15件商品,系统将提示用户点击“更多此类推荐”或“不感兴趣”来优化推荐。

—— 彭博社

via 风向旗参考快讯 - Telegram Channel
OpenAI硬件新进展:原型有了 两年内生产

OpenAI与苹果前首席设计官乔尼·艾维合作的神秘AI硬件有了最新消息。这款硬件已经有了原形品,有望在两年内生产。艾默生集团在周一举办了展示日活动。OpenAI CEO萨姆·奥尔特曼、艾维以及劳伦娜在台上进行了一场对话。奥尔特曼和艾维在这次活动上略微分享了他们的合作成果。两人表示,他们已经拥有了首批AI硬件原型,并预计将在不到两年的时间内开始生产。奥尔特曼表示:“我们终于做出了首批原形品。我简直无法相信它是如此精妙,令人兴奋。不过,现在回过头来看整个开发进程,可以看到所有要素都融入其中了,任何其他途径都难以达到这般效果,最终才孕育出了这个非凡成果。”

—— 凤凰网科技9to5mac

via 风向旗参考快讯 - Telegram Channel
GPT-5 and the future of mathematical discovery

via OpenAI News
#Update #Claude

Claude Opus 4.5 现已发布,宣称在多项编程基准测试中 SOTA。

与此同时,Claude App 中长对话不会再因为触碰到上下午限制而被截断。

via AI Copilot - Telegram Channel
亚马逊斥巨资为美国政府建AI基础设施

亚马逊宣布将投资高达五百亿美元,用于扩展公司面向美国政府客户的AWS人工智能和高性能计算 (HPC) 能力。这项投资计划将于2026年破土动工,通过在AWS Top Secret、AWS Secret和AWS GovCloud(US)Regions建设配备先进计算和网络技术的数据中心,新增近1.3吉瓦的AI和超级计算能力。亚马逊表示,在这些基础设施下,美国的联邦政府机构将获得更广泛的AWS人工智能服务访问权限,包括用于训练模型的SageMaker AI、用于代理部署的Bedrock、Claude模型,以及Trainium芯片和英伟达芯片。这些能力将帮助美国超过11,000个政府机构开发定制化AI解决方案、优化海量数据集处理等。

—— 财联社Techcrunch

via 风向旗参考快讯 - Telegram Channel
Opus 4.5模型发布 编程能力表现最佳

周一,Anthropic在官网宣布,公司推出了最新的AI模型“Claude Opus 4.5”。公司称,该模型智能高效,是目前全球在编码、智能代理和计算机应用方面表现最佳的模型,它在深度研究、处理幻灯片和电子表格等日常任务方面也显著优于其他模型。在智能体编程方面,该模型达到了当前最先进水平。根据用于衡量编程能力的测试集SWE-bench,其的表现要优于Gemini 3 Pro以及GPT-5.1。公司表示,允许Claude在不同浏览器标签之间执行操作的扩展工具Claude for Chrome现已向所有Max用户开放;能够理解和编辑电子表格的Claude for Excel,也已向所有付费用户推出。公司还将 Claude Code 引入其桌面应用,并为开发者平台增加了新的功能。

—— 财联社

via 风向旗参考快讯 - Telegram Channel
微软发布Fara-7B 能直接在PC上运行 性能可与GPT-4o媲美

11月24日,微软宣布推出7B参数AI模型Fara-7B,定位为“计算机使用代理(Computer Use Agent, CUA)”,可直接在用户本地设备上运行复杂任务。Fara-7B不仅实现了同等规模下的最佳性能,还使AI代理摆脱了对庞大云端模型的依赖,可在资源有限的系统上实现低延时与更强的数据隐私保障。

iframe (videos.ctfassets.net)

据介绍,Fara-7B的架构直击企业用户最关注的数据安全需求。由于模型足够精简,可以在本地运行,用户可在敏感工作流程(如内部账户管理或涉密数据处理)中实现自动化,相关信息始终不会离开本地设备,极大提高了隐私和合规性。

Fara-7B通过“看屏操作”进行网页交互。它使用截图,像人类一样通过“视觉感知”页面布局,预测坐标完成点击、输入、滚动等动作,并不依赖于浏览器的底层无障碍树结构。这种仅靠像素级视觉信息“操作”的方法,使其可以在代码结构混乱、页面难以解析的网站上正常工作。

微软研究院高级产品经理Yash Lara表示,完全在本地处理视觉输入,实现了真正的“像素主权”,让自动化和数据推理过程均不出本地,从而满足医疗、金融等强监管行业的合规需求。

在WebVoyager等标准测试中,Fara-7B的任务成功率为73.5%,优于资源耗费更大的GPT-4o(65.1%)和UI-TARS-1.5-7B(66.4%)等模型。同时,Fara-7B完成任务平均只需16步,而UI-TARS-1.5-7B为41步,效率明显提升。此外,Fara-7B在准确率与成本之间表现出最佳性价比。

不过,微软也强调该模型仍存在通用AI系统的问题,如幻觉、复杂指令处理失误等。为降低风险,Fara-7B引入了“关键点”机制:在涉及用户个人数据或不可逆动作(如发送邮件、金融操作)前,模型会主动暂停并请求用户确认。微软设计了配套的人机交互UI(Magentic-UI),让用户及时干预、避免过度打扰。

Fara-7B的开发采用“知识蒸馏”方式,将多智能体系统的大量成功案例(14.5万个由Magentic-One生成的自动导航轨迹)压缩转化到单一模型中。其底座模型为Qwen2.5-VL-7B,具备最长128,000词的上下文窗口和强大的文本与视觉元素对齐能力。整个过程以监督微调为主,让模型“模仿”人类专家的示范。

对于未来,微软强调不会一味增大模型体量,而是聚焦“让小模型更聪明更安全”。后续计划将合成环境中的强化学习机制(RL)引入训练,让Fara-7B在沙箱环境中自主学习。

目前,Fara-7B已通过MIT协议在Hugging Face及微软Foundry平台开放发布,允许商用,但微软提醒模型尚未达到生产级别,主要适合原型开发和测试。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)

Invalid media:
image
image
image
亚马逊AWS宣布向美国政府投入500亿美元建设AI基础设施

亚马逊云计算服务(AWS)日前宣布,将投资500亿美元为美国政府建设专属的高性能AI计算基础设施。此举旨在大幅提升美国联邦政府机构对AWS人工智能服务的访问能力和应用水平。

据AWS介绍,这一项目将新增1.3吉瓦的算力,并拓展政府机构对一系列AWS产品的使用,包括Amazon SageMaker AI平台、模型定制、Amazon Bedrock、模型部署以及Anthropic公司开发的Claude聊天机器人等。建设工作预计将于2026年正式动工。

AWS首席执行官Matt Garman在新闻稿中表示:“我们针对美国政府打造的AI和云计算基础设施,将从根本上改变联邦机构利用超级计算资源的方式。我们正在赋予政府机构更广泛的AI能力,帮助他们加速推进网络安全、药物研发等关键任务。这项投资将消除长期以来阻碍政府发展的技术壁垒,使美国在人工智能时代继续保持领先地位。”

AWS与美国政府合作已有十余年,早在2011年就开始为其搭建云计算基础设施。2014年,公司推出了首个用于处理机密任务的“气隙”式商业云Top Secret-East。2017年,AWS又推出了可支持所有安全级别的数据服务AWS Secret Region。

过去一年,科技巨头纷纷向美国政府推广AI服务。例如,OpenAI今年1月为联邦政府机构专门推出了定制版ChatGPT,并于8月宣布,允许政府机构以每年1美元的价格访问企业版ChatGPT。同期,Anthropic公司也以同价开放了Claude聊天机器人的企业版服务。Google则推出了“Google for Government”,首年仅收取0.47美元费用。

AWS此项大规模AI基础设施投资,凸显了科技行业与政府深度合作的加速趋势,以及美国在全球人工智能发展中的战略布局。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Anthropic发布Opus 4.5模型 新增Chrome与Excel集成功能

Anthropic正式发布了其旗舰人工智能模型的最新版本——Opus 4.5。这是Anthropic 4.5系列中最后一个亮相的版本,此前Sonnet 4.5于今年九月发布,Haiku 4.5则在十月推出。

Opus 4.5在多个基准测试中表现突出,包括编码基准(SWE-Bench和Terminal-bench)、工具使用(tau2-bench和MCP Atlas)以及通用问题解决能力(ARC-AGI 2、GPQA Diamond)。值得注意的是,Opus 4.5成为首个在权威编码基准SWE-Bench Verified得分超过80%的模型。

除了性能提升,Anthropic还着重展示了Opus 4.5在计算机操作和表格处理方面的新能力,并同步推出一系列相关产品,用以验证模型在实际应用中的效果。Opus 4.5发布的同时,Claude for Chrome和Claude for Excel这两款此前处于试点阶段的产品将面向更广泛的用户开放。Chrome扩展将向所有Max用户开放,Excel版本则覆盖Max、团队及企业用户。

新版本还通过对模型记忆管理方式进行重大优化,在长文本和长上下文任务中带来了显著提升。Anthropic产品管理负责人Dianne Na Penn指出:“我们在长上下文质量上做了改进,但仅仅加长上下文窗口还不够,如何记住关键细节同样至关重要。”

这些升级也促成了许多用户呼吁已久的新功能,例如为付费Claude用户提供的“无限对话”模式。此功能允许模型在上下文窗口达到上限时自动压缩记忆,无需中断聊天流程或提示用户。

部分升级聚焦于智能代理(agentic use-case)场景,特别是Opus作为主模型指挥由Haiku驱动的子代理时的应用。此类任务依赖于强大的工作记忆,而Opus 4.5的记忆力优化在此类场景中价值尤为突出。Penn表示:“记忆力是基础,Claude不仅要能探索代码库、大型文档,还要知道何时回溯复查。”

Opus 4.5将在市场上面对其他前沿模型的激烈竞争,包括OpenAI于11月12日发布的GPT 5.1与Google在11月18日推出的Gemini 3。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
Model usage attribution issues

Nov 24, 18:15 UTC
Investigating - We're investigating an issue where some users' Sonnet model usage was counted as Opus usage.

via Claude Status - Incident History
Elevated Claude Code Error Rates

Nov 24, 16:30 UTC
Resolved - Claude Code error rates were briefly elevated for some models. We identified the root cause and quickly rolled it back.

via Claude Status - Incident History
Elevated Errors on Claude Code

Nov 24, 16:00 UTC
Resolved - Some Claude Code users may have experienced higher than normal error rates. We have identified the issue and made a fix.

via Claude Status - Incident History
三星效仿苹果AI战略 将Perplexity AI集成进Bixby语音助手

继苹果为Siri引入多模型AI策略后,三星也开始效仿类似路径,计划在即将发布的Galaxy S26系列中,将Perplexity的AI技术集成至自家Bixby语音助手中。

据知名爆料人士@chunvn8888在社交平台X透露,这项整合将保留Bixby负责本地简单任务(如切换设置、执行基础系统操作)的功能,而涉及复杂推理及生成式内容的查询,则将交由Perplexity模型处理。

当前,苹果的Apple Intelligence已采用本地模型负责简单任务,较为复杂的推理与生成任务则借助OpenAI的ChatGPT完成。三星和Perplexity的组合,正是类似的分工逻辑。不过,三星与Google之间已经建立了深入的AI合作,最新Galaxy设备在其定制One UI界面中内置了Gemini驱动的AI功能。此次引入Perplexity,显示出三星正尝试拓展AI模型阵营,而非只依赖Google生态。

与此同时,苹果也在积极扩展其多模型AI战略。据彭博社报道,苹果正开发能力更强大的新一代Siri,高级功能将依赖GoogleGemini(如摘要与多步骤规划),而部分功能仍由苹果自研模型提供支持。新版Siri原计划随iOS 18亮相,但因苹果决定重构助手的核心架构,初步预计将在明年初的一次软件更新中推出。

有消息称,三星将在S26系列发布会上首次展示集成Perplexity的Bixby。具体实现为:基础任务仍由Bixby处理,复杂推理及需要更多“思考”的问题交由Perplexity回应,形式上类似苹果通过Apple Intelligence和ChatGPT的结合。

尽管苹果在部分高级AI应用上依赖外部合作伙伴,但据悉其内部对自研大语言模型(LLM)同样投入巨大,目标是在2026年推出基于云的复杂推理模型。届时,Siri有望实现更复杂的跨应用任务处理,整体体验将更接近Claude和ChatGPT。不过,苹果并不计划推出独立的聊天机器人应用。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
阿里千问启用全新域名qianwen[.]com

阿里巴巴旗下AI助手 “千问” 正式启用全新域名qianwen.com,进一步提升用户的访问便捷性。用户现可通过网页端直接体验千问的能力,与应用实现无缝一致的使用体验。据官方介绍,千问网页端面向专业用户开放了更多Qwen3系列模型体验选择。此外千问网页端还增加了 “对话分组” 功能,方便用户管理对话记录。“千问” 是代表阿里巴巴全力进军AI to C市场的项目,基于全球性能第一的开源模型Qwen3,凭借免费,以及与各类生活场景生态的结合,与ChatGPT展开全面竞争。自今年11月17日开启公测以来千问捷报频频。最新数据显示,开启公测仅一周,千问App全网累计下载量已突破1000万次。

—— 凤凰网科技

via 风向旗参考快讯 - Telegram Channel
阿里千问启用全新域名qianwen.com 支持Qwen3系列更多模型

今日,阿里旗下 AI 助手“千问”正式启用全新域名 qianwen.com,进一步提升用户的访问便捷性。用户现可通过网页端直接体验千问强大的能力,与 App 端实现无缝一致的使用体验。

据介绍,千问网页端面向专业用户开放了更多Qwen3系列模型体验选择,包括Qwen3-Max-Thinking-Preview、Qwen3-Coder等十余款。

千问网页端上也有代码、深度研究等更适合PC上操作的功能。此外千问网页端还增加了“对话分组”功能,方便用户管理对话记录。

“千问”是代表阿里巴巴全力进军AI to C市场的项目,基于全球性能第一的开源模型Qwen3,凭借免费,以及与各类生活场景生态的结合,与ChatGPT展开全面竞争。

自11月17日开启公测以来千问捷报频频。最新数据显示,开启公测仅一周,千问App全网累计下载量已突破1000万次。

这一爆发式增长速度一举超越了ChatGPT、Sora及DeepSeek的同期表现,刷新行业纪录,成为史上增长最快的AI应用。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
谷歌将于明年3月为用户终止谷歌助理服务

谷歌公司已经逐步在其众多产品中弃用谷歌助理,转向由人工智能驱动的Gemini,涵盖Google TV、Wear OS、Android、Android车机(AAOS)等平台。早在今年三月,谷歌就宣布经典版谷歌助理将于今年晚些时候在大多数移动设备上无法访问。目前,若用户不愿切换至Gemini,安卓用户仍可选择使用谷歌助理。您可通过谷歌助理与Gemini的设置轻松切换这两个助手。谷歌现已明确给出了谷歌助理在安卓系统上保留可用的具体时间范围。根据谷歌官方支持页面说明,Gemini将在大多数移动设备上取代谷歌助理,经典谷歌助理将持续提供服务至2026年3月。

—— thespandroid.blogspot

via 风向旗参考快讯 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]