https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Anthropic支持加州人工智能安全法案SB 53

周一,Anthropic宣布正式支持由加州参议员斯科特·维纳提出的SB 53法案,该法案将对全球最大的AI模型开发者实施全美首个透明度要求。Anthropic 在博文中说:“虽然我们认为前沿AI安全最好在联邦层面解决,而非各州法规拼凑而成,但强大的AI进步不会等待华盛顿达成共识。问题不在于我们是否需要AI治理,而在于我们是今天深思熟虑地制定,还是明天被动地做出反应。 SB 53 为前者提供了一条可靠路径。”若获通过,SB 53将要求前沿AI模型开发者制定安全框架,并在部署强大AI模型前发布公共安全与安保报告。该法案还将建立举报人保护机制。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
Bilibili发布 IndexTTS2:情感可控、时长可控的零样本语音合成模型

Bilibili 团队近日公布了全新开源语音合成模型 IndexTTS2。该模型在保持自回归大规模 TTS(Text-to-Speech)自然度优势的同时,引入了时长可控机制,主要面向需要严格音画同步的场景,如视频配音。

据介绍,IndexTTS2 支持两种生成模式:

一种可通过明确指定生成的 token 数实现精确时长控制;

另一种则自由生成,保持输入提示的韵律特征。

模型在设计上实现了情感表达与音色的解耦,使得用户可在零样本条件下独立控制说话者音色与情感风格。其训练过程结合 GPT 潜在表示,并采用三阶段训练范式以提升稳定性。同时,团队还通过微调 Qwen3 引入基于文本描述的“软指令”机制,降低了情感控制的门槛。

在多项数据集评测中,IndexTTS2 在词错误率、说话人相似度和情感保真度等指标上均优于现有零样本 TTS 模型。

Github
GitHub
GitHub - index-tts/index-tts: An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System

An Industrial-Level Controllable and Efficient Zero-Shot Text-To-Speech System - index-tts/index-tts


via LoopDNS资讯播报 - Telegram Channel
百度宣布文心X1.1深度思考模型上线 事实性比文心X1提升34.8%

9月9日,在WAVE SUMMIT深度学习开发者大会2025期间,百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰正式发布了文心大模型X1.1深度思考模型,该模型在事实性、指令遵循、智能体等能力上均有显著提升。

当前,用户可以通过文心一言官网和文小言APP上体验并使用文心大模型X1.1。此外,文心大模型X1.1已正式登陆百度智能云千帆平台,面向企业客户以及开发者全面开放应用。

据王海峰现场介绍,文心大模型X1是基于文心大模型4.5训练而来的深度思考模型,升级后的X1.1主要采用了迭代式混合强化学习训练框架,一方面通过混合强化学习,同时提升通用任务和智能体任务的效果;另一方面通过自蒸馏数据的迭代式生产及训练,不断提升模型整体效果。相比文心X1,X1.1的事实性提升34.8%,指令遵循提升12.5%,智能体提升9.6%。

在多个权威基准评测中,文心X1.1整体表现超越DeepSeek R1-0528,在部分任务上展现出领先优势。同时,在与国际顶尖模型GPT-5和Gemini 2.5 Pro相比,效果持平。

文心大模型能够实现能力范围的拓展与运行效率的显著提升,这离不开飞桨文心二者联合优化所发挥的关键作用。在大会现场,百度重磅发布了飞桨核心框架3.2版本,该版本在大模型训练、硬件适配以及生态支持等多个关键领域实现了全方位升级。与此同时,百度还对大模型开发套件ERNIEKit和高效部署套件FastDeploy进行了同步升级。

值得注意的是,百度方面的最新数据显示,飞桨文心生态开发者达到2333万,服务企业达到76万家。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球科技)
OpenAI将推长篇AI动画电影 预定2026年戛纳亮相

如今AI时代大潮席卷人类社会多个领域,动画行业首当其冲,AI领军企业OpenAI日前宣布,将联合Vertigo Films公司,使用旗下AI工具DALL·E打造长篇AI动画电影,预定2026年5月戛纳电影节亮相,敬请期待。

·根据外媒The Wall Street Journal的报道称,新的动画长篇电影名为“Critterz”,制作预算约为3000万美元,根据同名短篇作品改编,讲述了住在森林中的神秘生物们突然理解了人类解说并开始说话交流的故事。

·动画长篇电影名为“Critterz”编剧邀请了James Lamont与Jon Foster的组合担任,制作团队主要靠人类策划师制定规则和大纲,靠DALL·E完全生成完成,敬请期待。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:3DMGame)
Windows 11 Copilot 推出全新“首页”界面 AI体验更接近开始菜单

微软正在为Windows 11的Copilot智能助手推送全新“Home(首页)”界面,这取代了以往以对话为核心的传统设计。新界面让人联想到Windows的开始菜单,因为它成为所有AI功能的集成入口,类似于过去的应用或文件访问。

升级后,用户在Copilot界面可见一个全新的首页标签页,顶部的标题栏允许在“首页”和原先的对话主界面之间切换。在首页标签页中,微软以动态卡片替代了静态的布局,这些卡片不仅仅罗列功能,还能让用户直接跳转至最近访问的文件。

例如,用户可以通过“快速访问”文件区,方便地对最近文件进行“打开”“附加进提示”“总结”等操作,也可一键隐藏最近文件部分。

此次更新后,Copilot首页还整合了诸多常用功能。例如,用户不仅能便捷返回先前的AI对话,还可开启类似ChatGPT Canvas的“Copilot Pages”,进行文档、代码的编辑等操作。同时,全新“应用引导帮助”卡片为用户带来创新的学习体验。系统会列出近期应用(如Power BI、文件资源管理器、WhatsApp等),点击后启动“Vision(视觉)”模式,允许Copilot识别屏幕内容和语音,从而为用户提供更为直观的操作指引。这一特性需用户授权Copilot访问屏幕,授权后系统能根据用户当前界面主动提供支持。

此外,未来更新将引入Agent智能体,允许Copilot自动打开终端和浏览器,在Azure云的Linux Shell下操作,实现如在线订票或行程规划等自动化任务。目前Agent功能尚未登陆Windows 11 Copilot,有望在下一次升级中上线。

微软此举明显希望将Copilot从单一的AI对话助手转型为Windows生态核心伙伴。用户今后可借助首页,快速编辑文档、查找本地文件、获取个性化帮助。虽然目前新首页功能仍有限,但其发展潜力巨大。

值得注意的是,Copilot全新首页正面向所有用户分阶段推送,部分用户可能需稍后才能看到该界面。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
🍎 苹果寻求AI突破:Siri或将引入谷歌Gemini模型

9月9日消息,在新款iPhone发布前夕,彭博社评论指出,苹果正考虑通过外部合作来提升其人工智能能力。鉴于内部AI研发进展不顺,尤其Siri被批为“智障AI”,苹果正与谷歌测试和微调定制版Gemini AI模型,以支持内容摘要等功能,该模型将在苹果服务器上运行。此举被视为一种务实且灵活的策略,可避免高昂的自研成本和风险。尽管苹果在今年美股“科技七巨头”中表现第二差(仅次于特斯拉),但与竞争对手合作被认为是确保iPhone未来AI功能实用性的明智之举,用户更关注功能而非底层技术提供商。苹果也曾考虑Anthropic的Claude模型,但因要价过高而放弃。

(IT业界资讯)

via 茶馆 - Telegram Channel
Google AI Mode 现已支持多个非英语语种

Google上月在全球180多个国家上线了AI模式(AI Mode),但当时仅对英语用户开放。近日,Google宣布该功能已新增五种语言支持,包括印地语、日语、印尼语、韩语和巴西葡萄牙语,这意味着非英语用户也能体验到强大的生成式AI搜索功能。

Google表示,AI模式借助Gemini 2.5模型的先进多模态与推理能力,能够更好地理解不同地区语言的细微差别。此次扩展具有重要意义,光是印地语的使用者(含母语和第二语言)就超过了6.09亿,在全球最常用语言中排第三,仅次于英语和普通话。而印尼语(2.524亿)和日语(1.256亿)也都跻身前二十。

AI模式今年初首次推出,作为AI概览(AI Overviews)的升级版,可为搜索用户自动生成全面摘要。该模式采用“查询分散”技术,会就一个问题在多个子主题和数据源进行搜索,再整合为一份详尽解答。

在后续几个月里,Google对AI模式进行了多次更新:集成了Gemini 2.5的定制版本,引入“搜索直播”选项,用户可与AI进行实时互动对话。同时还增强了金融等领域数据可视化与图表功能,支持通过实时摄像头视频流进行智能识别,以优化搜索结果。

值得注意的是,Google还于上月Pixel 10系列新品发布时,为AI模式引入了更智能的代理和个性化功能。例如,用户可以基于自己的时间、地点和用餐人数偏好,直接让AI推荐餐厅并协助预订。Google此次在全球范围推进AI模式多语言支持,将有望让更多用户享受到AI驱动的搜索与信息整合体验。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
黄仁勋将随特朗普下周对英国进行国事访问

了解行程的知情人士周一称,英伟达CEO黄仁勋将于下周随特朗普总统出访英国,进行国事访问。除黄仁勋外,预计将有多位美国商界领袖陪同特朗普出访,包括OpenAI CEO萨姆·奥尔特曼、黑石集团CEO斯蒂芬·施瓦茨曼以及贝莱德集团CEO拉里·芬克。苹果公司CEO蒂姆·库克也收到了随行邀请。这些商界名流预计将与特朗普一同出席下周由查尔斯国王主办的国宴。尽管黄仁勋缺席了上周特朗普在白宫举办的科技CEO晚宴,但此次随其出访英国的安排,凸显出英伟达公司在寻求在中国出售新一代“Blackwell”芯片许可证之际,对维护与总统关系的重视程度。

—— CNBC

via 风向旗参考快讯 - Telegram Channel
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]