https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.netfly.top
BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析

Buy ads: https://telega.io/c/AI_News_CN
Elevated errors for requests to Claude Sonnet 4.5

Nov 7, 06:57 UTC
Investigating - We are currently investigating this issue.

via Claude Status - Incident History
🚀 谷歌发布Magika 1.0:AI文件类型检测工具升级,速度与精度大幅提升

谷歌已发布其基于人工智能的文件类型检测工具Magika的稳定版本Magika 1.0。该工具的整个引擎已用Rust语言重写,显著提升了速度和内存安全性。Magika 1.0现在能够识别超过200种文件类型,是此前约100种的两倍,并能更精确地区分JSON与JSONL、TSV与CSV等相似格式。谷歌团队利用3TB的训练数据集,并借助Gemini为罕见文件类型生成合成样本,以增强其处理能力。此外,Magika 1.0支持Python和TypeScript集成,并提供原生的Rust命令行客户端。

(科技圈)

via 茶馆 - Telegram Channel
🤖OpenAI CEO奥尔特曼澄清政府兜底传闻,预计2030年营收达数千亿美元

OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)紧急澄清了此前首席财务官关于寻求政府为AI投资提供“兜底”或“担保”的言论,强调OpenAI不寻求政府为其数据中心提供担保,并表示纳税人不应救助决策失误的公司。他解释称,首席财务官的本意是美国政府应建立“国家战略算力储备”以服务公共利益。

为打消投资者对巨额AI支出的担忧(公司已签署超1.4万亿美元基础设施协议),奥尔特曼强调了OpenAI强大的创收能力。他表示,公司今年的年化营收有望超过200亿美元(高于首席财务官9月预测的130亿美元),并计划到2030年将销售额提升至数千亿美元。尽管OpenAI目前估值达5000亿美元,但尚未实现盈利。受此前言论影响,美国科技股周四集体下跌,纳指跌近2%。

(IT业界资讯)

via 茶馆 - Telegram Channel
研究指出AI能力可能因存在缺陷的测试而被夸大

根据牛津互联网研究院最新发布的一项研究,目前用于评估人工智能系统能力的方法常因缺乏科学严谨性而“高估”了AI的实际表现。该研究由牛津互联网研究院牵头,联合三十多位学者,对445项主流AI测试(即“基准测试”)进行了审查。研发者和研究人员常以这些基准测试来评价模型性能,并据此宣称技术进步。然而,此项研究认为这些基础测试本身的可靠性存在疑问,呼吁重新审视相关基准的有效性。

研究发现,许多顶级基准测试未能明确界定评测目标,频繁复用已有数据和测试方法,且很少采用可靠的统计方法比较不同模型结果。有作者指出,AI在被要求完成特定任务时,实际测量对象常常与预期目标并不一致。例如常用的GSM8K数学基准测试,虽然正确答案能显示模型基本算术能力,但未必能代表其真正的数学或推理水平。

研究还指出,半数基准未清晰定义所测量的概念,使测试结果难以真实反映AI模型在现实中的表现。作者建议,基准制定者应更清楚界定测试范畴,开发更具代表性的任务集,并以统计分析方式比较性能表现。

作为改善措施,论文提出八项建议,包括增加透明度和可信度的检查清单。目前已有人提出以更贴合现实需求的测试方式,如OpenAI推出的面向44种真实职业任务的新测试;中心安全团队也制定了用于评估远程工作自动化任务能力的新基准。

该研究认为,AI测试仍处于科学评估的初期阶段,需持续探索更有效的评测路径,以推动AI实际能力的客观判断。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
特斯拉将量产版 Roadster 2 的发布时间推迟至明年愚人节

特斯拉首席执行官埃隆·马斯克在公司年度股东大会上表示,特斯拉将于2026年4月1日——也就是愚人节当天,发布第二代Roadster超级跑车的量产版。距离该项目首次亮相已过去近九年。

马斯克以频繁“跳票”著称,他在会上坦言选择愚人节是因为“这样可以给自己留些余地”,如果再次发生延期,“我可以说只是在开玩笑”。事实上,这意味着又一次推迟——就在一周前,马斯克在Joe Rogan播客节目中还声称计划在今年年底前展示新车。

马斯克强调新款Roadster“将与此前展示的车型有很大不同”,同时再次预告相关演示将是“史上最令人兴奋的,无论成功与否”,暗示多年来他一直在尝试让新Roadster具备某种飞行能力,甚至可能安装由SpaceX打造的推进器。

按照马斯克的说法,第二代Roadster量产预计将在2026年4月发布后的12至18个月内启动生产。

在股东问答环节中,有投资者询问能否让已预订“创始人系列”Roadster的客户参与发布会。这些客户在2017年支付了25万美元,抢订了特别版新车。马斯克回答表示,“当然可以,这是对长期耐心等待的Roadster预订者最起码的回馈。”

值得注意的是,OpenAI首席执行官Sam Altman也是这些等待多年的预订者之一,他最近尝试取消预订,并希望能退还5万美元定金,但最初未能如愿。Altman在社交平台X上发布了“分三幕”的经历,包括预订截图、退款申请,以及邮件被退回。Altman感叹“真的很期待这辆车!也理解延期,但等了七年半确实太久了。”

马斯克随后公开回应,表示“你忘了说第四幕:问题已解决且你在24小时内收到了退款。”并称这属于Altman的“性格使然”。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:cnBeta.COM)
AMD苏姿丰:有多家“OpenAI规模”客户排队购买AI芯片

在最新的第三季度财报电话会议上,AMD首席执行官苏姿丰透露,继与OpenAI达成预计带来巨额营收的合作后,目前有多家客户希望与AMD建立规模相似的合作关系。针对“OpenAI合作对市场地位的影响”以及“客户集中度风险”的提问,苏姿丰表示:

“与OpenAI的合作意义重大,并提高了其他客户的兴趣和参与度。我们正在规划与多家规模与OpenAI相当的客户进行合作,以确保拥有广泛的客户基础,从而减轻客户集中度风险。”

AMD与OpenAI的交易预计将产生1000亿美元的收入,这也意味着AMD正获得主流人工智能行业的广泛关注。

AMD也正“加倍押注”Instinct MI450等AI芯片,不仅在架构上进行改进,还在能效和机架级配置方面持续发力。

苏姿丰也透露了下一代 AI 芯片的上市时间表,Instinct MI355系列已经开始提高产量,强劲势头将持续到2026年;Instinct MI450系列预计将于明年下半年推向市场。

根据AMD高管此前的说法,MI450系列将是AMD AI征程中的关键时刻,有望拉近与NVIDIA产品的差距,将AMD的数据中心和AI业务带入主流细分市场。

此外苏姿丰还在财报会议上确认,AMD已经获得了MI308 AI芯片对中国的出口许可,MI308的官方参数尚未公布,但业界普遍推测,其性能规格将接近NVIDIA H20。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
麦肯锡:九成组织已在用 AI,但“规模化”仍是瓶颈

麦肯锡《The state of AI in2025》报告指出,88% 的受访者表示其组织在至少一个业务职能中常规使用AI,相比一年前(78%)显著增长,表明AI使用正在普及。

但在企业级别实现规模化仍未普遍:约三分之二的受访组织仍处于试验或试点阶段,只有约三分之一开始在更广范围内扩展AI计划。大公司(年营收>50亿美元)比小型公司更容易进入规模化阶段。

分析师评论:报告强调——工具普及并不等于价值落地。虽然多数组织在用AI,但只有少数实现了可观的企业层面EBIT贡献(报告中称仅39%认为AI已产生企业层面的EBIT影响,且大多数的影响低于5%)。这凸显从“用”到“用好”的管理与流程改造需求。

对大多数企业而言,未来两年关键不是是否采用AI,而是如何通过重构工作流、治理与人才投入,把AI从点上成果变为面上价值。

via AI新闻资讯 (author: AI Base)
Google 推出 Gemini API 文件搜索工具:简化私有 RAG 集成,开发者无需自建向量数据库

Google 今日正式推出 Gemini API 中的“文件搜索工具”(File Search Tool),一款完全托管的 RAG 系统。该工具将私有文件无缝转化为 Gemini 的知识库,用户无需自行处理数据分块、嵌入生成或向量存储等繁琐步骤,直接通过 API 集成即可实现高效检索与生成。

工具核心功能:一站式 RAG 流程打包文件

搜索工具的核心在于其端到端的集成设计。它自动处理文件上传、索引和检索过程,利用 Google 的 Gemini Embedding 模型(gemini-embedding-001)生成高质量向量表示,支持语义搜索而非简单关键词匹配。这意味着开发者可以专注于应用逻辑,而非底层基础设施维护。

据 Google 官方博客介绍,该工具支持多种常见文件格式,包括 PDF、DOCX、TXT、JSON,以及各种编程语言文件(如 Python、Java 等源代码)。用户只需通过 Gemini API 的 generateContent 接口调用,即可将私有文档导入知识库。系统会智能分块数据,确保检索结果的上下文连贯性,并在响应中自动生成引用链接,直接指向文档的具体部分,从而提升输出的透明度和可验证性。

这一设计特别适用于企业级场景,例如内部知识助手、智能支持机器人或内容发现平台。Google 强调,对于海量数据、频繁更新、重复查询或需要严格可追溯性的应用,该工具能显著降低开发门槛,并提供可扩展的性能支持。

创新计费模式:查询免费,首次索引低至0.15美元/百万词元

与传统 RAG 解决方案不同,文件搜索工具采用全新的计费范式:查询期间的存储和嵌入生成完全免费,仅在首次索引文件时收取嵌入生成费用。该费用基于词元(token)计算,使用 gemini-embedding-001模型的标准率为每百万词元0.15美元。这使得工具在成本控制上更具竞争力,尤其适合大规模部署和实验性项目。Google 产品经理在公告中指出:“这一计费模式大幅降低了 RAG 实现的入门门槛和运营成本,帮助开发者更快地将 AI 落地。” 后续文件更新或增量索引将仅按实际变化部分计费,进一步优化了资源利用效率。

via AI新闻资讯 (author: AI Base)
铁甲钢拳变现实!宇树科技“Embodied Avatar”让人类分身机器人瞬间觉醒

科幻照进现实——人类终于可以“远程附身”机器人了。全球人形机器人领军企业宇树科技(Unitree Robotics)近日正式推出 “Embodied Avatar”系统,通过高精度动作捕捉与毫秒级远程控制,让用户像操控虚拟角色一样,实时驱动实体机器人完成拳击、舞蹈、精细操作等复杂动作,真正实现“所动即所行”的具身智能体验。

该系统的核心在于全链路低延迟动作映射。用户佩戴标准动作捕捉设备后,全身23至43个关节点的运动数据将被实时采集,并通过5G与边缘计算技术传输至远程机器人。无论是挥拳、跳跃,还是拾取小物件,机器人均能以毫秒级响应同步复现,最大关节扭矩达120N·m,确保在动态环境中保持平衡与力量输出。演示视频中,机器人流畅完成连贯武术套路与街舞动作,稳定性与拟人度令人惊叹。

技术底座依托宇树自研的UnifoLM(Unitree机器人统一大模型),结合模仿学习与强化学习,使机器人不仅能精确复刻动作,还能在新环境中自主微调姿态,提升适应性。用户可通过专用App、Web界面甚至VR设备接入“分身”,获得沉浸式操控体验,未来还将支持触觉反馈,进一步模糊虚拟与实体的边界。

不止于炫技,更面向真实场景落地。Embodied Avatar已规划三大应用方向:

工业:工程师远程操控机器人进入危险区域巡检;

医疗:医生“化身”机器人进行远程问诊或辅助康复训练;

教育与娱乐:学生操控机器人参与实验,创作者在元宇宙中驱动实体分身表演。

目前,该平台测试版已向开发者与企业开放。宇树科技透露,未来将支持多机器人协同控制,打造“分身军团”,并持续集成更多AI能力。作为全球首款售价仅9.9万元起的高性能人形机器人G1的缔造者,宇树正以“低成本+高智能”策略加速具身AI普及。

当然,挑战并存。动作数据的隐私保护与远程控制的安全性成为关键。对此,宇树承诺采用端到端加密传输,确保用户行为数据不被泄露。

AIbase认为,Embodied Avatar的发布,标志着人形机器人从“预设程序执行者”迈向“人类能力延伸体”的关键转折。当每个人都能拥有一个可远程操控的实体分身,科幻电影中的未来,已悄然走入现实。而这一次,中国公司站在了舞台中央。

via AI新闻资讯 (author: AI Base)

Invalid media: video
OpenAI 官方证实:GPT-5 Thinking 模型“思考过程”泄露细节曝光

近日,一份据称来自内部测试的“GPT-5Thinking”模型思考过程(Chain of Thought, CoT)泄露文件在网络上流传,揭示了该模型在复杂推理任务中的隐藏逻辑链条。

OpenAI 公司已于今日通过官方渠道正式证实该泄露的真实性,并强调这并非安全漏洞,而是模型设计中的创新特性。该事件不仅暴露了 GPT-5在 Sudoku 等逻辑谜题解决中的独特“思考语言”,还引发了业界对 AI 自主推理能力的广泛讨论。

据泄露文件显示,“GPT-5Thinking”是一种专为高级推理优化的变体模型,其内部推理过程采用隐藏式链式思考机制。这意味着模型在处理问题时,会在不直接输出给用户的情况下,进行多步逻辑推演,以提升准确性和效率。在一份 Sudoku 谜题测试示例中,该模型的思考链条使用了高度抽象的“语言”,如“评估网格约束→模拟填充路径→验证冲突阈值”,这与传统自然语言输出迥异,体现了 OpenAI 在模型架构上的突破。

OpenAI 在今日的官方声明中表示:“我们确认该泄露文件源于内部开发文档。GPT-5Thinking 的隐藏 CoT 设计是其核心创新,用于处理复杂编码和多模态任务,而非任何安全隐患。我们将继续优化模型透明度,以平衡用户体验与技术安全。”公司发言人还透露,该模型已在企业级应用中测试,支持“最小提示”下的复杂编程任务,并与竞争对手如 Llama4和 Cohere v2进行了基准比较。

via AI新闻资讯 (author: AI Base)
Robotaxi狂飙836%!全球首家Robotaxi公司成功回归港股

近日,这家被称为 “全球 Robotaxi 第一股” 的企业成功在港交所挂牌,成为首个登陆港股的 Robotaxi 公司,标志着其在智能出行领域的又一里程碑。

文远知行此次在港股发行价为27.1港币,共发售8825万股,市值高达240亿港币。这家公司的业绩在过去一年里实现了质的飞跃,Robotaxi 车队规模已超过700辆,整体无人车队则达到了1500辆。在第二季度,文远知行的 Robotaxi 业务营收同比增长了惊人的836%,这不仅显示了其市场需求的巨大潜力,也证明了其商业模式的成功。

根据文远知行的招股书,2025年上半年公司收入达2亿元,同比增长33.3%。其中,第二季度的总营收达到1.27亿元,环比增长75.4%,毛利率也保持在28%,远超行业平均水平。这些数据充分反映了公司在国际化进程中的快速扩张以及盈利能力的提升。

文远知行的业务不仅限于国内市场,他们在全球范围内已经在11个国家、30多个城市部署了 Robotaxi。特别是在阿布扎比,文远知行成为了首家入驻 Uber 自主驾驶专属分类的公司,这无疑为他们的国际化拓展打开了新的局面。

随着 Robotaxi 业务的飞速增长,文远知行还在加大研发投入。2025年第二季度的研发费用为3.19亿元,同比增长33.1%。这意味着,尽管成本上升,但公司在技术创新和市场开拓方面的决心与实力依然强劲。

整体来看,文远知行的上市不仅是自身成长的证明,更是整个 Robotaxi 行业发展的一次重要信号。随着 Robotaxi 的规模化商业落地逐渐成为现实,未来的市场前景更加令人期待。

via AI新闻资讯 (author: AI Base)
OpenAI 与 AWS 达成380亿美元协议,构建 AI 基础设施新格局

在最近的一项重大合作中,OpenAI 与亚马逊网络服务(AWS)签署了一项价值380亿美元的协议,确保未来七年内获得庞大的计算能力。此次协议将使 OpenAI 能够使用数十万台英伟达 GPU,这些计算资源将托管在亚马逊全球数据中心的专用集群中。这标志着 OpenAI 在快速发展的人工智能领域再次巩固了其基础设施布局。

随着 AI 技术的快速演变,OpenAI 的目标已不仅仅是租用云计算服务,而是希望在其模型的基础上,塑造出一个专属的基础架构。OpenAI 致力于构建可以跟上其模型发展的基础设施,而非仅依赖于其他公司的技术堆栈。OpenAI 希望与 AWS 合作,推动基础设施的交付,确保培训、调优和部署层面能够保持一致的进展。

OpenAI 首席执行官萨姆・阿尔特曼表示:“扩展前沿 AI 需要大量可靠的计算资源。” 而 AWS 首席执行官马特・加曼则补充道:“OpenAI 继续推动可能性的边界,而 AWS 的顶级基础设施将作为其 AI 雄心的支柱。” 此次合作不仅增强了 OpenAI 的计算生态系统,还为其未来的 AI 模型发布提供了必要的支持。

在这次合作中,OpenAI 的其他合作伙伴也各司其职。微软 Azure 帮助其训练核心模型,CoreWeave 负责快速实验性运行,甲骨文提供区域能力,而谷歌云则支持 ChatGPT 的工作负载。AWS 的加入为 OpenAI 提供了更大的带宽和更快的部署能力,使其能够灵活地在各个合作伙伴之间调度工作负载,避免瓶颈并快速扩展。

划重点:

1. 🌐 OpenAI 与 AWS 达成380亿美元协议,未来七年内提供庞大计算能力。

2. ⚙️ OpenAI 希望塑造专属基础架构,以支持快速发展的 AI 模型。

3. 🔗 AWS 的加入将增强 OpenAI 的计算生态,提升数据流动效率。


via AI新闻资讯 (author: AI Base)
亚马逊为自家出版的 Kindle 电子书提供AI翻译服务

亚马逊近日在其 Kindle 直接出版(KDP)平台上推出了一项名为 “Kindle Translate” 的 AI 翻译工具,旨在帮助自出版作者更方便地将电子书翻译成多种语言。目前该工具处于测试阶段,仅限于部分 KDP 作者使用。初期功能支持英语与西班牙语之间的翻译,以及德语到英语的翻译,并且作者使用该工具不需要支付额外费用。

自出版作者可以自由选择希望将书籍翻译成的语言,并为每种翻译设置单独的定价。翻译完成后,作者可以预览译文,确保满意后再进行发布。亚马逊表示,所有使用该工具翻译的作品在发布前都会经过自动评估,以确保翻译的准确性。此外,所有经过 AI 翻译的电子书上都会标注 “Kindle Translate” 标签,以便读者识别。

目前,亚马逊指出,其平台上 “少于5% 的书籍” 能够以多种语言提供,这一比例正是 “Kindle Translate” 工具希望能够改善的。通过该工具翻译的书籍同样有资格参加 KDP Select 和 Kindle Unlimited 计划。值得注意的是,这一翻译工具的推出时间恰逢亚马逊的有声书平台 Audible 在几个月前也推出了多语言 AI 叙述工具,显示出亚马逊在推动多语言内容创建方面的决心。

划重点:

📚 自出版作者可使用 “Kindle Translate” 免费翻译电子书,初期支持英语、西班牙语和德语。

💰 作者可为翻译作品设置独立定价,并在发布前预览翻译效果。

🌍 目前亚马逊平台上少于5% 的书籍支持多语言,翻译作品可参与 KDP Select 和 Kindle Unlimited。


via AI新闻资讯 (author: AI Base)
双11杀出黑马!钉钉AI录音笔DingTalk A1登顶多平台销量榜

在刚刚落幕的双11购物节中,一款国产AI硬件悄然登顶多个榜单,成为职场人群的“效率新宠”——钉钉首款AI硬件产品DingTalk A1不仅在天猫新品录音笔榜连续夺冠,关注人数突破60万,更在抖音3C数码家电类目中销量与成交额双第一,强势打破“AI办公设备=高价”的行业定式。

这款于今年8月25日发布的智能录音笔,凭借499元起的亲民定价(青春版499元,旗舰版799元),直接击穿同类产品动辄千元以上的价格壁垒,推动AI办公硬件走向普惠化。其核心竞争力在于深度软硬一体设计:内置低功耗AI音频芯片与大容量电池,支持长达15小时连续录音;软件端则依托钉钉自研大模型与AI听记引擎,实现语音实时转写、多语种翻译、会议智能摘要、关键议题提取等高阶功能,并无缝对接钉钉日程、待办与知识库,让会议内容自动转化为可执行任务。

实际应用中,DingTalk A1已成多类职场人群的“数字助手”。浙江一位律师反馈,过去整理客户访谈纪要需数小时,如今借助AI自动提炼要点,5分钟即可生成结构化报告;销售、行政、教师等群体也纷纷将其用于客户沟通复盘、课堂记录与跨部门协作。更关键的是,产品内置200+场景化分析模板,覆盖“客户异议处理”“项目复盘”“法律问询”等垂直需求,让AI真正“懂业务”。

企业市场同样反响热烈。多家大型企业已批量采购DingTalk A1企业版,用于管理层听会、一线销售陪访等场景,将语音数据沉淀为组织知识资产。有企业负责人表示:“现在高管无需亲临现场,也能通过AI生成的结构化摘要,精准掌握销售对话细节与客户真实反馈。”

为降低使用门槛,钉钉还为个人用户赠送免费语音转文字额度,进一步扩大AI办公的可及性。AIbase认为,DingTalk A1的成功,不仅在于硬件参数,更在于其将大模型能力深度嵌入真实工作流,实现了“录得清、听得懂、用得上”的闭环体验。当AI不再只是炫技,而是切切实实帮人省下几个小时,它就真正走进了职场人的日常。这场由钉钉掀起的AI办公普惠浪潮,或许才刚刚开始。

via AI新闻资讯 (author: AI Base)
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney API 2.8折起
[email protected]