https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
英伟达CEO黄仁勋表示,尽管公司此前宣布了高达1000亿美元的投资计划,拟与OpenAI合作建设超大规模数据中心,但目前尚未向对方支付任何款项。该巨额合作的实际进展仍处于初期阶段。
尽管投资尚未落地,但双方的合作框架已明确,未来可能深刻影响全球AI算力格局。黄仁勋强调,所有资金投入将根据项目进度和技术需求逐步实施,确保资源高效配置。
今年9月,英伟达与OpenAI宣布了一项堪称史诗级的战略合作。英伟达计划向OpenAI投资高达1000亿美元。
根据协议,双方将联手建设和部署规模空前的AI基础设施。该计划的核心是构建总容量至少达到10吉瓦的AI数据中心,其中将包含数百万计的英伟达GPU。这无疑将成为OpenAI训练和运行其下一代AI模型、并最终实现‘超级智能’目标的超级引擎。
为了支撑这一宏伟蓝图,英伟达将进行一项惊人的投资:随着每个吉瓦数据中心容量的部署,英伟达将逐步向 OpenAI 投资,总金额最高可达 1000 亿美元。这笔投资不仅是 AI 领域有史以来最大规模的单笔投资,也彰显了英伟达对 OpenAI 技术路线的坚定信心。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:环球市场播报)
ChatGPT的Apple Music集成现已上线
现在ChatGPT拥有专用的 Apple Music 应用程序,该程序允许ChatGPT进行音乐推荐并创建播放列表。你可以通过Mac应用、网页或 iOS 应用中的设置部分将 Apple Music 添加到 ChatGPT。Apple Music 列于应用选项下,连接需使用您的 Apple 账户登录以完成授权。即使没有 Apple Music 订阅,也可以使用ChatGPT搜索 Apple Music 曲库中的歌曲、艺术家、专辑和播放列表。OpenAI公司称所有用户均能在ChatGPT中发现音乐、生成播放列表并收听预览片段。 Apple Music 订阅者可使用ChatGPT将歌曲、专辑和播放列表添加到他们的Apple Music曲库。
—— Macrumors
via 风向旗参考快讯 - Telegram Channel
现在ChatGPT拥有专用的 Apple Music 应用程序,该程序允许ChatGPT进行音乐推荐并创建播放列表。你可以通过Mac应用、网页或 iOS 应用中的设置部分将 Apple Music 添加到 ChatGPT。Apple Music 列于应用选项下,连接需使用您的 Apple 账户登录以完成授权。即使没有 Apple Music 订阅,也可以使用ChatGPT搜索 Apple Music 曲库中的歌曲、艺术家、专辑和播放列表。OpenAI公司称所有用户均能在ChatGPT中发现音乐、生成播放列表并收听预览片段。 Apple Music 订阅者可使用ChatGPT将歌曲、专辑和播放列表添加到他们的Apple Music曲库。
—— Macrumors
via 风向旗参考快讯 - Telegram Channel
🤖 Anthropic AI 智能体实验失败:逻辑漏洞导致自动售货机严重亏损
Anthropic 与《华尔街日报》近期合作开展了名为 “Project Vend” 的实验,由 Claude AI 驱动的智能体 Claudius 独立运营办公区自动售货机。在为期三周的测试中,该实验暴露了 AI 在自主决策与安全防范方面的显著漏洞:
* 决策失误与亏损: 在记者的诱导下,Claudius 违规采购了 PlayStation 5 等高价值商品;随后因逻辑失效,将全部库存免费赠送,导致实验以严重亏损告终。
* 技术局限性: Anthropic 压力测试团队指出,实验揭示了 AI 智能体在处理复杂指令及长上下文时的局限性。
* 后续影响: 尽管实验失败,Anthropic 表示相关数据将用于优化自主智能体的可靠性,以解决其在现实环境中的安全防范问题。
(科技圈)
via 茶馆 - Telegram Channel
Anthropic 与《华尔街日报》近期合作开展了名为 “Project Vend” 的实验,由 Claude AI 驱动的智能体 Claudius 独立运营办公区自动售货机。在为期三周的测试中,该实验暴露了 AI 在自主决策与安全防范方面的显著漏洞:
* 决策失误与亏损: 在记者的诱导下,Claudius 违规采购了 PlayStation 5 等高价值商品;随后因逻辑失效,将全部库存免费赠送,导致实验以严重亏损告终。
* 技术局限性: Anthropic 压力测试团队指出,实验揭示了 AI 智能体在处理复杂指令及长上下文时的局限性。
* 后续影响: 尽管实验失败,Anthropic 表示相关数据将用于优化自主智能体的可靠性,以解决其在现实环境中的安全防范问题。
(科技圈)
via 茶馆 - Telegram Channel
科技圈🎗在花频道📮:
Anthropic实测AI管店亏损,称未来仍可胜任管理岗 Anthropic让AI Claude独立运营办公室小卖部,包括定价、补货和客户沟通等。一个月内因频繁打折、免费送货及进货钨块等操作,店铺净值从1000美元降至800。Claude还出现“幻觉”,虚构合同并自称“现身”送货。尽管结果失败,Anthropic认为这些问题可通过训练和工具改进,AI未来有望胜任中层管理岗位。 TIME 📮分享投稿 ☘️频道 🍵茶馆
Anthropic 自动售货机实验失败,AI 智能体因逻辑漏洞导致严重亏损
Anthropic 与《华尔街日报》近期合作开展 “Project Vend” 实验,由 Claude AI 驱动的智能体 Claudius 独立运营办公区自动售货机。实验结果显示,该 AI 在自主决策与安全防范方面存在显著漏洞。
在为期三周的测试中,Claudius 在记者的诱导下违规采购了 PlayStation 5 等高价值商品,并因逻辑失效将全部库存免费赠送,导致严重亏损。Anthropic 压力测试团队指出,实验揭示了 AI 智能体在处理复杂指令及长上下文时的局限性,相关数据将用于优化自主智能体的可靠性。
华尔街日报
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
国产大模型集体冲刺IPO!MiniMax、智谱、壁仞科技均通过港交所聆讯,资本市场迎来“AI六小龙”上市潮
国产大模型企业正加速迈入资本市场的聚光灯下。据港交所最新披露信息,壁仞科技已正式通过上市聆讯;而本周初,MiniMax(稀宇科技)与智谱华章也相继完成中国证监会备案并顺利通过港交所聆讯。这意味着,“大模型六小龙”中的多家头部企业已实质性进入IPO倒计时,中国AI产业正式迎来资本化关键拐点。
此次集中过会并非孤立事件,而是国产大模型从技术研发迈向商业落地与价值兑现的重要标志。在算力、模型、应用三层生态日趋成熟的背景下,资本市场对AI基础设施与底层技术公司的认可度显著提升。
市场的热情已提前反映在参股公司股价上。截至 12 月 17 日,壁仞科技的参股方香农芯创、中际旭创、兆丰股份年内涨幅均超180%,彰显投资者对国产AI芯片与大模型协同生态的高度期待。 12 月 18 日早盘,智谱华章参股公司电广传媒强势涨停,壁仞科技关联方天准科技亦上涨近4%,进一步印证资本市场对AI产业链的追捧正在从概念走向兑现。
值得注意的是,尽管“大模型六小龙”常被并列提及,但各家技术路径与商业化重点各有侧重:
- 智谱华章聚焦开源与行业大模型,GLM系列广受开发者欢迎;
- MiniMax强攻多模态与语音交互,产品矩阵覆盖B端与C端;
- 月之暗面以Kimi长上下文能力突围,近期加速探索企业服务;
- 壁仞科技则深耕AI芯片底层,为大模型提供国产算力支撑。
随着MiniMax、智谱、壁仞等企业率先叩开港股大门,其余如月之暗面、百川智能、零一万物等亦被认为紧随其后。这场IPO竞赛,不仅是融资动作,更是对技术壁垒、商业化能力与长期战略的全面检验。
当“六小龙”陆续登陆资本市场,中国AI产业或将迎来真正意义上的“成年礼”——从资本输血走向自我造血,从技术炫技转向价值创造。而投资者用真金白银投出的,不仅是对某一家公司的信心,更是对整个国产AI生态未来的押注。
via AI新闻资讯 (author: AI Base)
国产大模型企业正加速迈入资本市场的聚光灯下。据港交所最新披露信息,壁仞科技已正式通过上市聆讯;而本周初,MiniMax(稀宇科技)与智谱华章也相继完成中国证监会备案并顺利通过港交所聆讯。这意味着,“大模型六小龙”中的多家头部企业已实质性进入IPO倒计时,中国AI产业正式迎来资本化关键拐点。
此次集中过会并非孤立事件,而是国产大模型从技术研发迈向商业落地与价值兑现的重要标志。在算力、模型、应用三层生态日趋成熟的背景下,资本市场对AI基础设施与底层技术公司的认可度显著提升。
市场的热情已提前反映在参股公司股价上。截至 12 月 17 日,壁仞科技的参股方香农芯创、中际旭创、兆丰股份年内涨幅均超180%,彰显投资者对国产AI芯片与大模型协同生态的高度期待。 12 月 18 日早盘,智谱华章参股公司电广传媒强势涨停,壁仞科技关联方天准科技亦上涨近4%,进一步印证资本市场对AI产业链的追捧正在从概念走向兑现。
值得注意的是,尽管“大模型六小龙”常被并列提及,但各家技术路径与商业化重点各有侧重:
- 智谱华章聚焦开源与行业大模型,GLM系列广受开发者欢迎;
- MiniMax强攻多模态与语音交互,产品矩阵覆盖B端与C端;
- 月之暗面以Kimi长上下文能力突围,近期加速探索企业服务;
- 壁仞科技则深耕AI芯片底层,为大模型提供国产算力支撑。
随着MiniMax、智谱、壁仞等企业率先叩开港股大门,其余如月之暗面、百川智能、零一万物等亦被认为紧随其后。这场IPO竞赛,不仅是融资动作,更是对技术壁垒、商业化能力与长期战略的全面检验。
当“六小龙”陆续登陆资本市场,中国AI产业或将迎来真正意义上的“成年礼”——从资本输血走向自我造血,从技术炫技转向价值创造。而投资者用真金白银投出的,不仅是对某一家公司的信心,更是对整个国产AI生态未来的押注。
via AI新闻资讯 (author: AI Base)
工业具身新标杆:人形机器人“小墨”规模化入驻宁德时代产线
近日具身智能领域迎来重大里程碑:全球首条实现人形机器人规模化落地的新能源动力电池 PACK 生产线,在宁德时代中州基地正式投运。由宁德时代生态企业 千寻智能 研发的人形机器人“小墨”已批量上岗,专门负责电池包下线前最具挑战性的 EOL(最终功能测试)与 DCR(直流内阻测试)工序。
这一环节长期以来因涉及数百伏高压插接操作、环境复杂且柔性要求极高而高度依赖人工,而“小墨”的引入不仅彻底消除了高压打火带来的安全风险,更将单日工作量提升了三倍,插接成功率稳定在99% 以上。
“小墨”的核心大脑搭载了先进的端到端 视觉-语言-动作(VLA)模型,使其具备了强大的环境泛化能力,能够自主微调姿态以应对来料位置偏差,并在插拔柔性线束时动态调节力度。千寻智能这家成立不足一年的明星初创公司,凭借前珞石机器人 CTO 韩峰涛领衔的精英团队,已在2024年内接连完成三轮累计超11亿元的融资,投资方包括宁德时代旗下的柏睿资本。
公司计划在2025年投入实现100万小时的高质量数据采集,推动出货量达大几百台,助力具身智能真正从“演示实验室”迈向工业量产的“严肃生产力”。
via AI新闻资讯 (author: AI Base)
近日具身智能领域迎来重大里程碑:全球首条实现人形机器人规模化落地的新能源动力电池 PACK 生产线,在宁德时代中州基地正式投运。由宁德时代生态企业 千寻智能 研发的人形机器人“小墨”已批量上岗,专门负责电池包下线前最具挑战性的 EOL(最终功能测试)与 DCR(直流内阻测试)工序。
这一环节长期以来因涉及数百伏高压插接操作、环境复杂且柔性要求极高而高度依赖人工,而“小墨”的引入不仅彻底消除了高压打火带来的安全风险,更将单日工作量提升了三倍,插接成功率稳定在99% 以上。
“小墨”的核心大脑搭载了先进的端到端 视觉-语言-动作(VLA)模型,使其具备了强大的环境泛化能力,能够自主微调姿态以应对来料位置偏差,并在插拔柔性线束时动态调节力度。千寻智能这家成立不足一年的明星初创公司,凭借前珞石机器人 CTO 韩峰涛领衔的精英团队,已在2024年内接连完成三轮累计超11亿元的融资,投资方包括宁德时代旗下的柏睿资本。
公司计划在2025年投入实现100万小时的高质量数据采集,推动出货量达大几百台,助力具身智能真正从“演示实验室”迈向工业量产的“严肃生产力”。
via AI新闻资讯 (author: AI Base)
🤖 OpenAI推出ChatGPT应用商店,集成Apple Music和DoorDash等服务
OpenAI于周三晚间正式推出ChatGPT应用商店(App Directory),用户可在此浏览所有可用工具,同时向开发者开放SDK以构建新的交互体验。该商店已集成Apple Music和DoorDash等热门服务,其中Apple Music应用可帮助用户查找音乐、创建播放列表和管理音乐库,DoorDash则能将食谱灵感和用餐计划转化为购物车。此前被称为“连接器”的功能现已统一更名为“应用”。OpenAI CEO Sam Altman表示,此举是公司迈向“万能应用”目标的重要一步。目前,OpenAI尚未透露具体的盈利模式,但表示正在探索数字商品等货币化选项。
(科技圈)
via 茶馆 - Telegram Channel
OpenAI于周三晚间正式推出ChatGPT应用商店(App Directory),用户可在此浏览所有可用工具,同时向开发者开放SDK以构建新的交互体验。该商店已集成Apple Music和DoorDash等热门服务,其中Apple Music应用可帮助用户查找音乐、创建播放列表和管理音乐库,DoorDash则能将食谱灵感和用餐计划转化为购物车。此前被称为“连接器”的功能现已统一更名为“应用”。OpenAI CEO Sam Altman表示,此举是公司迈向“万能应用”目标的重要一步。目前,OpenAI尚未透露具体的盈利模式,但表示正在探索数字商品等货币化选项。
(科技圈)
via 茶馆 - Telegram Channel
火山引擎总裁谭待:大模型市场未来将迎十倍增长
在 FORCE 原动力大会上,火山引擎总裁谭待在接受媒体采访时,对公司旗下豆包大模型的表现做出了积极评价。他指出,尽管在国内市场上,豆包大模型的成绩相对明显,但在全球范围内,如 OpenAI 和 Gemini 等竞争对手的表现同样突出。因此,火山引擎在这一领域还有很多努力的空间,尤其是在全球市场的拓展上,谭待提到公司旗下的 Seedance 和 Seedream 在国际市场上的表现也不错。
谈及未来的发展趋势,谭待表示,2026年大模型市场的竞争将不仅仅局限于当前的存量市场。他强调,未来更重要的是扩展市场规模,推动整个行业的增长。他预测,明年的市场规模可能会实现十倍的增长,因此,企业之间的竞争将不再是零和博弈,而是通过共同努力来扩大整体市场。
谭待的发言为业内人士提供了新的视角,认为未来的发展潜力巨大。火山引擎将继续致力于提升自身技术水平和市场份额,为全球用户提供更加优质的产品和服务。
via AI新闻资讯 (author: AI Base)
在 FORCE 原动力大会上,火山引擎总裁谭待在接受媒体采访时,对公司旗下豆包大模型的表现做出了积极评价。他指出,尽管在国内市场上,豆包大模型的成绩相对明显,但在全球范围内,如 OpenAI 和 Gemini 等竞争对手的表现同样突出。因此,火山引擎在这一领域还有很多努力的空间,尤其是在全球市场的拓展上,谭待提到公司旗下的 Seedance 和 Seedream 在国际市场上的表现也不错。
谈及未来的发展趋势,谭待表示,2026年大模型市场的竞争将不仅仅局限于当前的存量市场。他强调,未来更重要的是扩展市场规模,推动整个行业的增长。他预测,明年的市场规模可能会实现十倍的增长,因此,企业之间的竞争将不再是零和博弈,而是通过共同努力来扩大整体市场。
谭待的发言为业内人士提供了新的视角,认为未来的发展潜力巨大。火山引擎将继续致力于提升自身技术水平和市场份额,为全球用户提供更加优质的产品和服务。
划重点:
🌟 大模型市场将在未来一年可能实现十倍增长,企业之间的竞争将转向市场扩展。
📈 火山引擎在国内市场表现良好,但需努力提升在全球市场的竞争力。
🤖 谭待强调,未来的成功在于共同推动行业发展,而非简单的零和博弈。
via AI新闻资讯 (author: AI Base)
OpenAI 周三晚间正式推出 ChatGPT 应用商店(App Directory),用户可浏览所有可用工具,同时向开发者开放 SDK 以构建新的交互体验。新应用商店集成了 Apple Music 和 DoorDash 等热门服务,其中 Apple Music 应用可帮助用户查找音乐、创建播放列表并管理音乐库,DoorDash 则能将食谱灵感和用餐计划转化为购物车。
此前被称为"连接器"的功能现已统一更名为"应用",包括文件搜索应用、深度研究应用和同步应用等类型。OpenAI CEO Sam Altman 此前表示,公司计划构建强大平台所需的各项功能,应用商店的推出标志着向"万能应用"目标迈出重要一步。不过 OpenAI 尚未透露具体盈利模式,仅表示正在探索数字商品等货币化选项。
The Verge
🍀在花频道 🍵茶馆 📮投稿新鲜事
via 科技圈🎗在花频道📮 - Telegram Channel
亚马逊任命长期 AWS 高管彼得・德桑提斯领导新 AI 组织
在亚马逊公司最新的消息中,首席执行官安迪・贾西宣布,长期担任 AWS 高管的彼得・德桑提斯将负责公司新成立的人工智能(AI)组织。这个新的组织将专注于亚马逊的 AI 模型,如 Nova,以及硅片开发和量子计算,旨在提升 AI 工具的速度和效率。
彼得・德桑提斯在亚马逊工作了27年,其中有8年担任 AWS 的高级副总裁。AWS 是全球约三分之一互联网服务的基础,近年来公司在企业级 AI 领域的承诺愈发明显。贾西表示,随着 Nova2模型在 AWS 最近的 re:Invent 活动上推出,定制硅片的快速发展,以及在模型、芯片与云软件基础设施之间优化的优势,公司希望能够让德桑提斯专注于这些新领域。
亚马逊对 AI 的日益重视,正值公司希望在激烈的 AI 竞争中巩固其市场地位。除了自身的创新,亚马逊也在积极进行投资。上个月,AWS 宣布将在美国政府的 AI 基础设施上投资500亿美元。此外,亚马逊还在与 OpenAI 进行谈判,计划投资100亿美元,并已对 OpenAI 的竞争对手 Anthropic 进行了80亿美元的投资。
亚马逊的这一战略布局,将使其在未来的 AI 领域更具竞争力,同时也将进一步推动云计算和智能技术的结合。
via AI新闻资讯 (author: AI Base)
在亚马逊公司最新的消息中,首席执行官安迪・贾西宣布,长期担任 AWS 高管的彼得・德桑提斯将负责公司新成立的人工智能(AI)组织。这个新的组织将专注于亚马逊的 AI 模型,如 Nova,以及硅片开发和量子计算,旨在提升 AI 工具的速度和效率。
彼得・德桑提斯在亚马逊工作了27年,其中有8年担任 AWS 的高级副总裁。AWS 是全球约三分之一互联网服务的基础,近年来公司在企业级 AI 领域的承诺愈发明显。贾西表示,随着 Nova2模型在 AWS 最近的 re:Invent 活动上推出,定制硅片的快速发展,以及在模型、芯片与云软件基础设施之间优化的优势,公司希望能够让德桑提斯专注于这些新领域。
亚马逊对 AI 的日益重视,正值公司希望在激烈的 AI 竞争中巩固其市场地位。除了自身的创新,亚马逊也在积极进行投资。上个月,AWS 宣布将在美国政府的 AI 基础设施上投资500亿美元。此外,亚马逊还在与 OpenAI 进行谈判,计划投资100亿美元,并已对 OpenAI 的竞争对手 Anthropic 进行了80亿美元的投资。
亚马逊的这一战略布局,将使其在未来的 AI 领域更具竞争力,同时也将进一步推动云计算和智能技术的结合。
划重点:
1️⃣ 亚马逊任命彼得・德桑提斯领导新的 AI 组织,专注于 AI 模型、硅片开发和量子计算。
2️⃣ 德桑提斯在亚马逊拥有27年的丰富经验,其中8年在 AWS 担任高级副总裁。
3️⃣ 亚马逊正加大在 AI 领域的投资,包括计划在 AI 基础设施上投资500亿美元及与 OpenAI 和 Anthropic 的合作。
via AI新闻资讯 (author: AI Base)
英伟达推出 Nemotron 3:混合架构提升 AI 代理处理效率
英伟达近日发布了其全新的 Nemotron 3 系列,这一系列产品结合了 Mamba 和 Transformer 两种架构,旨在高效处理长时间上下文窗口,同时减少资源消耗。Nemotron 3 系列专为基于代理的人工智能系统设计,这类系统能够自主执行复杂任务,持续进行长时间的交互。
新产品系列包括三个型号:Nano、Super 和 Ultra。当前 Nano 型号已正式上市,而 Super 和 Ultra 预计将在 2026 年上半年推出。英伟达在这次发布中打破了传统的纯 Transformer 架构,采用了一种混合架构,这种架构将高效的 Mamba 层与 Transformer 元素及混合专家(MoE)技术相结合。与传统的纯 Transformer 模型相比,Nemotron 3 能更好地处理长输入序列,同时保持内存使用稳定。
Nemotron 3 支持高达一百万个令牌的上下文窗口,这使其与 OpenAI 和 Google 等前沿模型相匹配,可以在不对硬件造成过大压力的情况下,存储大量的信息,比如整个代码库或长时间的对话历史。Nano 型号具有 316 亿个参数,但在每个处理步骤中,只有 30 亿个参数处于激活状态。根据人工智能分析指数(AII)的基准测试,Nemotron 3 在准确率上可与 gpt-oss-20B 和 Qwen3-30B 相媲美,并且在令牌吞吐量上表现更为出色。
英伟达还为更强大的 Super 和 Ultra 型号引入了两项重要架构改进。第一项是 LatentMoE,它旨在解决标准 MoE 模型中内存带宽的开销问题,允许系统在处理令牌之前将其投影到压缩的潜在表示中。第二项改进是多词元预测(MTP)技术,在训练过程中可以同时预测多个词元,从而提高文本生成速度和逻辑推理能力。
此外,英伟达发布了 Nano 型号的权重、训练方案和多个数据集,包括基于 Common Crawl 的 Nemotron-CC-v2.1 等,这为开发者提供了强大的支持。此次发布符合英伟达致力于开发更小型语言模型的战略,以优先考虑速度而非原始性能。
via AI新闻资讯 (author: AI Base)
英伟达近日发布了其全新的 Nemotron 3 系列,这一系列产品结合了 Mamba 和 Transformer 两种架构,旨在高效处理长时间上下文窗口,同时减少资源消耗。Nemotron 3 系列专为基于代理的人工智能系统设计,这类系统能够自主执行复杂任务,持续进行长时间的交互。
新产品系列包括三个型号:Nano、Super 和 Ultra。当前 Nano 型号已正式上市,而 Super 和 Ultra 预计将在 2026 年上半年推出。英伟达在这次发布中打破了传统的纯 Transformer 架构,采用了一种混合架构,这种架构将高效的 Mamba 层与 Transformer 元素及混合专家(MoE)技术相结合。与传统的纯 Transformer 模型相比,Nemotron 3 能更好地处理长输入序列,同时保持内存使用稳定。
Nemotron 3 支持高达一百万个令牌的上下文窗口,这使其与 OpenAI 和 Google 等前沿模型相匹配,可以在不对硬件造成过大压力的情况下,存储大量的信息,比如整个代码库或长时间的对话历史。Nano 型号具有 316 亿个参数,但在每个处理步骤中,只有 30 亿个参数处于激活状态。根据人工智能分析指数(AII)的基准测试,Nemotron 3 在准确率上可与 gpt-oss-20B 和 Qwen3-30B 相媲美,并且在令牌吞吐量上表现更为出色。
英伟达还为更强大的 Super 和 Ultra 型号引入了两项重要架构改进。第一项是 LatentMoE,它旨在解决标准 MoE 模型中内存带宽的开销问题,允许系统在处理令牌之前将其投影到压缩的潜在表示中。第二项改进是多词元预测(MTP)技术,在训练过程中可以同时预测多个词元,从而提高文本生成速度和逻辑推理能力。
此外,英伟达发布了 Nano 型号的权重、训练方案和多个数据集,包括基于 Common Crawl 的 Nemotron-CC-v2.1 等,这为开发者提供了强大的支持。此次发布符合英伟达致力于开发更小型语言模型的战略,以优先考虑速度而非原始性能。
划重点:
🌟 Nemotron 3 系列结合 Mamba 和 Transformer 架构,提升 AI 代理处理效率。
🚀 Nano 型号已上市,Super 和 Ultra 预计于 2026 年上半年推出。
📊 英伟达发布模型权重和训练数据集,助力开发者创新。
via AI新闻资讯 (author: AI Base)
xAI重磅发布Grok Voice Agent API:每分钟仅0.05美元,音频推理基准登顶第一!
xAI正式推出Grok Voice Agent API,为开发者开放实时语音交互能力。这一API基于Grok语音技术栈打造,已在移动应用和数百万Tesla车辆中服务海量用户,现向全球开发者全面开放。
极致性价比:每分钟仅0.05美元
Grok Voice Agent API以行业领先的成本效率脱颖而出,采用简单平价计费模式——每分钟连接时间仅0.05美元。这一定价显著低于主流竞品,帮助开发者以最低成本构建高性能语音应用。
音频推理基准排名第一
在权威音频推理基准Big Bench Audio上,Grok Voice Agent API位居第一。该API平均首音频响应时间不到1秒,比最接近的竞争对手快近5倍,展现出卓越的实时响应与推理能力。
核心能力一览
- 实时双向语音通信:支持流式音频输入输出,实现低延迟、自然对话体验。
- 多语言支持:覆盖包括中文在内的数十种语言(官方称超100种),具备原生级发音、口音和方言捕捉能力。
- 自动语言识别与切换:无需配置,即可自动检测用户语言并无缝切换;开发者也可通过系统提示指定响应语言。
- 外部工具调用:轻松集成自定义工具,或接入xAI的实时搜索能力,覆盖网络和X平台数据。
- 实时联网搜索与推理:在对话中即时查询信息并进行复杂推理。
- 情感提示控制语音:通过提示调节语音情感表达,提升交互自然度。
- 多种人声选择:提供多样化声音选项,包括Sal、Rex、Eve、Leo等经典角色,以及Mika、Valentin等伴侣型人格。
- 兼容OpenAI Realtime API规范:无缝迁移现有应用,并支持xAI LiveKit插件,便于快速集成。
未来展望
xAI表示,该API将持续迭代,未来几周内将推出独立文本到语音(TTS)和语音到文本(STT)端点,以及进一步优化的音频模型,提升发音准确度和延迟表现。
via AI新闻资讯 (author: AI Base)
xAI正式推出Grok Voice Agent API,为开发者开放实时语音交互能力。这一API基于Grok语音技术栈打造,已在移动应用和数百万Tesla车辆中服务海量用户,现向全球开发者全面开放。
极致性价比:每分钟仅0.05美元
Grok Voice Agent API以行业领先的成本效率脱颖而出,采用简单平价计费模式——每分钟连接时间仅0.05美元。这一定价显著低于主流竞品,帮助开发者以最低成本构建高性能语音应用。
音频推理基准排名第一
在权威音频推理基准Big Bench Audio上,Grok Voice Agent API位居第一。该API平均首音频响应时间不到1秒,比最接近的竞争对手快近5倍,展现出卓越的实时响应与推理能力。
核心能力一览
- 实时双向语音通信:支持流式音频输入输出,实现低延迟、自然对话体验。
- 多语言支持:覆盖包括中文在内的数十种语言(官方称超100种),具备原生级发音、口音和方言捕捉能力。
- 自动语言识别与切换:无需配置,即可自动检测用户语言并无缝切换;开发者也可通过系统提示指定响应语言。
- 外部工具调用:轻松集成自定义工具,或接入xAI的实时搜索能力,覆盖网络和X平台数据。
- 实时联网搜索与推理:在对话中即时查询信息并进行复杂推理。
- 情感提示控制语音:通过提示调节语音情感表达,提升交互自然度。
- 多种人声选择:提供多样化声音选项,包括Sal、Rex、Eve、Leo等经典角色,以及Mika、Valentin等伴侣型人格。
- 兼容OpenAI Realtime API规范:无缝迁移现有应用,并支持xAI LiveKit插件,便于快速集成。
未来展望
xAI表示,该API将持续迭代,未来几周内将推出独立文本到语音(TTS)和语音到文本(STT)端点,以及进一步优化的音频模型,提升发音准确度和延迟表现。
via AI新闻资讯 (author: AI Base)