https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
三度结缘除夕夜!宇树科技官宣成为2026年总台春晚机器人合作伙伴
1月26日,国产机器人领军企业宇树科技正式宣布,已成为“中央广播电视总台2026年春晚机器人合作伙伴”。这标志着宇树科技将第三次代表中国顶尖科技力量,在除夕之夜向全球观众展示具身智能的最新突破。
宇树科技与春晚的渊源已久,每一次亮相都精准踩在了机器人技术进化的节点上:
● 2021年(牛年): 宇树四足机器牛“犇犇”首次登台,以灵活的跳跃和群体协作能力惊艳全场。
● 2025年(蛇年): 由张艺谋导演执导的人形机器人表演《秧 BOT》实现“现象级”破圈,展现了人形机器人在艺术表现力上的巨大潜力。
● 2026年(马年): 宇树表示将再度携手总台,通过更具沉浸感的交互与先进技术,打造一场“引领全球科技进步”的视觉盛宴。
在过去的2025年中,宇树科技凭借极高的出货量和场景落地能力,已稳居全球人形机器人“第一梯队”。此次再度入选春晚合作伙伴,不仅是对其技术稳定性的认可,更彰显了中国厂商在具身智能规模化商用进程中的领跑地位。
via AI新闻资讯 (author: AI Base)
1月26日,国产机器人领军企业宇树科技正式宣布,已成为“中央广播电视总台2026年春晚机器人合作伙伴”。这标志着宇树科技将第三次代表中国顶尖科技力量,在除夕之夜向全球观众展示具身智能的最新突破。
宇树科技与春晚的渊源已久,每一次亮相都精准踩在了机器人技术进化的节点上:
● 2021年(牛年): 宇树四足机器牛“犇犇”首次登台,以灵活的跳跃和群体协作能力惊艳全场。
● 2025年(蛇年): 由张艺谋导演执导的人形机器人表演《秧 BOT》实现“现象级”破圈,展现了人形机器人在艺术表现力上的巨大潜力。
● 2026年(马年): 宇树表示将再度携手总台,通过更具沉浸感的交互与先进技术,打造一场“引领全球科技进步”的视觉盛宴。
在过去的2025年中,宇树科技凭借极高的出货量和场景落地能力,已稳居全球人形机器人“第一梯队”。此次再度入选春晚合作伙伴,不仅是对其技术稳定性的认可,更彰显了中国厂商在具身智能规模化商用进程中的领跑地位。
via AI新闻资讯 (author: AI Base)
最新情报显示,Kimi K2.5已悄然在网络上发布,这一升级迅速引发行业热议。
据多方信息汇总,Kimi K2.5已于近日在Moonshot AI官网(kimi.com)低调上线。这一版本并非大张旗鼓的宣传,而是通过web界面默默推送给用户。用户反馈显示,原本的K2模型在聊天界面中已自动切换为K2.5,包括思考模式(Thinking)和多模态支持。这次更新被视为对K2系列的迭代优化,旨在进一步提升AI的智能交互能力。AIbase认为,这种“静默 rollout”的策略,或许是为了快速迭代并收集用户反馈,避免过早曝光潜在问题。
新功能亮点:视觉与工具调用双升级
Kimi K2.5的最大亮点在于其原生支持视觉能力和工具调用功能。不同于以往版本,用户现在可以直接上传图像进行分析,例如基于图片生成3D模型或解读复杂布局。测试显示,该模型在视觉任务上表现抢眼,能准确处理如电视剧场景平面图的转换,甚至生成Three.js格式的3D模型。此外,工具调用功能让Kimi K2.5更接近“代理式智能”,能够步步推理解决数学、逻辑或编程问题。相比K2,从K2到K2.5的质量跃升被形容为“如同从Gemini2.5Pro到Gemini3Pro的巨大进步”,这也为未来的K3版本设定了更高标准。AIbase分析指出,这些增强将显著提升Kimi在实际应用中的实用性,尤其在开源社区和开发者群体中。
用户反馈:性能惊艳,开源期待高涨
从网络反馈来看,Kimi K2.5一经上线便收获好评。多名用户表示,该模型在编码和视觉测试中“轻松过关”,例如快速生成朋友公寓的3D模型,或处理复杂提示时展现出更强的推理能力。开源社区对此尤为兴奋,有人称赞这是“开源界的喜庆日子”,并期待Moonshot AI尽快开源完整模型。目前,通过API接口已可访问部分功能,包括思考和多模态支持。AIbase注意到,虽然尚未正式宣布开源,但相关讨论已暗示这可能成为Kimi系列的下一个里程碑,用户对性能的认可也为AI竞赛注入新活力。
总体而言,Kimi K2.5的发布标志着Moonshot AI在AI领域的持续发力。这一升级不仅强化了模型的核心竞争力,也为用户提供了更智能、更全面的工具。AIbase将持续跟踪后续动态,敬请关注更多AI前沿报道。
via AI新闻资讯 (author: AI Base)
谷歌地位不保?超 7 成订阅用户已将 ChatGPT 设为浏览器主页
在搜索引擎市场统治了数十年的谷歌,正面临前所未有的“入口危机”。 根据订阅服务平台 Bango 的最新调查报告,全球72% 的 ChatGPT 订阅用户 已经将ChatGPT网页版设为手机或电脑浏览器的默认主页。
搜索格局的“静默重塑”
这一数据如果属实,意味着搜索引擎的逻辑正在发生根本性逆转。
流量截流:过去几十年,谷歌依靠每年向苹果支付数百亿美元来锁定默认搜索地位。而现在,数以亿计的用户正主动绕过传统搜索框,将ChatGPT作为探索互联网的第一站。
反垄断阴云:谷歌正陷入非法维持搜索垄断地位的法律诉讼中,而ChatGPT的崛起可能从市场层面直接瓦解其垄断根基。
巨头间的“深水区”博弈
尽管面临ChatGPT的入口拦截,谷歌并未坐以待毙:
Gemini 的反击:在谷歌推出 Gemini3助手后,ChatGPT的用户规模曾出现约6% 的短期下降。
苹果阵营变数:谷歌正通过与苹果合作强化“Apple 智能”,试图进一步稀释OpenAI的市场份额。
OpenAI 的红色警戒:面对日益激烈的竞争,萨姆·奥尔特曼已宣布公司进入“红色警戒”状态,力求通过ChatGPT搜索功能的迭代稳固地盘。
观察:互联网入口的定义权之争
谷歌长久以来扮演着互联网“路标”的角色,但 AI 正在将其变为“答案提供者”。当用户不再需要通过搜索链接去寻找信息,而是直接与 AI 交流获取结果时,传统的“搜索-点击”广告模型将面临巨大挑战。
via AI新闻资讯 (author: AI Base)
在搜索引擎市场统治了数十年的谷歌,正面临前所未有的“入口危机”。 根据订阅服务平台 Bango 的最新调查报告,全球72% 的 ChatGPT 订阅用户 已经将ChatGPT网页版设为手机或电脑浏览器的默认主页。
搜索格局的“静默重塑”
这一数据如果属实,意味着搜索引擎的逻辑正在发生根本性逆转。
流量截流:过去几十年,谷歌依靠每年向苹果支付数百亿美元来锁定默认搜索地位。而现在,数以亿计的用户正主动绕过传统搜索框,将ChatGPT作为探索互联网的第一站。
反垄断阴云:谷歌正陷入非法维持搜索垄断地位的法律诉讼中,而ChatGPT的崛起可能从市场层面直接瓦解其垄断根基。
巨头间的“深水区”博弈
尽管面临ChatGPT的入口拦截,谷歌并未坐以待毙:
Gemini 的反击:在谷歌推出 Gemini3助手后,ChatGPT的用户规模曾出现约6% 的短期下降。
苹果阵营变数:谷歌正通过与苹果合作强化“Apple 智能”,试图进一步稀释OpenAI的市场份额。
OpenAI 的红色警戒:面对日益激烈的竞争,萨姆·奥尔特曼已宣布公司进入“红色警戒”状态,力求通过ChatGPT搜索功能的迭代稳固地盘。
观察:互联网入口的定义权之争
谷歌长久以来扮演着互联网“路标”的角色,但 AI 正在将其变为“答案提供者”。当用户不再需要通过搜索链接去寻找信息,而是直接与 AI 交流获取结果时,传统的“搜索-点击”广告模型将面临巨大挑战。
via AI新闻资讯 (author: AI Base)
继去年12月领到1.2亿欧元的巨额罚单后,马斯克旗下的X 平台(原 Twitter)再次被欧盟送上了被告席。就在今天,欧盟委员会宣布启动针对该平台的最新正式调查,而这次的核心引爆点,是其内置的人工智能机器人 Grok。
监管风暴再起:Grok 成了“深伪制造机”?
此次调查的焦点在于X 平台是否未能有效履行监管义务,阻止 Grok 生成深度伪造(Deepfake)内容。
多国联手抵制:最近几周,Grok 因涉嫌生成并传播深度伪造的色情图像引发了全球公愤,英国、法国和印度的相关监管部门已先后采取实质性行动。
亚洲、北美同步发难:不仅是欧洲,日本政府此前也因不雅图像问题要求马斯克进行整改,而美国加州相关部门则对 Grok 涉嫌“一键脱衣”的功能展开了深度调查。
马斯克的对策:主动“灭火”能否奏效?
面对多方围剿,X 平台的回应显得颇为忙碌。
封禁与删除:平台声称已采取措施主动删除非法内容、封禁违规账户,并表示正与执法部门通力协作,试图制止色情图像的进一步蔓延。
合规压力剧增:根据欧盟2023年生效的《数字服务法案》,大型在线平台必须系统性地评估并缓解服务带来的风险。一旦被判定违规,X 平台可能面临最高相当于其全球年营业额6% 的天价罚款。
话题追踪:马斯克 AI 的“黑色一月”
从今年初开始,Grok 几乎成了监管名单上的常客:
1月10日:印尼因涉色情图片问题,临时封禁了 Grok 服务。
1月12日:由于生成色情内容,Grok 在全球范围内面临多国封禁的风险。
1月26日:欧盟正式介入,将调查上升至“正式调查”级别。
这场关于 AI 生成界限与平台监管责任的博弈,正将马斯克的 AI 野心推向生死存亡的十字路口。当“言论自由”遇上“深伪色情”,法律的红线显然已经收紧。
via AI新闻资讯 (author: AI Base)
医疗 AI 进入手术室:英国 NHS 试点机器人与 AI 联合诊断肺癌
英国国家医疗服务体系(NHS)正迈出抗击癌症的关键一步。 1 月 26 日,NHS England 宣布将启动一项结合人工智能(AI)与机器人技术的临床试验,旨在加速英国最致命癌症——肺癌的早期发现与诊断。
该试点项目在伦敦的 Guy's and St Thomas' 医院开展。 其核心技术包含两个关键环节:首先,AI 软件会深度扫描肺部影像,精准识别出直径小至 6 毫米(约米粒大小)的疑似癌变结节,这些细微病灶在传统筛查中极易被忽略; 随后,一台机器人驱动的微型摄像头将引导穿刺工具深入肺部,在极高精度下完成活检取样。
这项技术有望将长达数周的反复扫描与等待缩短为一次仅需 30 分钟的诊疗流程,极大减轻了患者的心理压力和侵入性手术风险。 与此同时,NHS 承诺到 2030 年,将为全英所有吸烟者及前吸烟者提供肺癌筛查。 据预测,这一系列举措到 2035 年将帮助诊断出 5 万例肺癌患者,其中近半数处于早期阶段,有望挽救数千人的生命。
肺癌目前在英国每年夺走约 3.3 万人的生命,且在贫困地区的发病率显著更高。 NHS 希望通过这种“未来式”的检测手段,打破健康不平等现状,通过更早的介入治疗提升整体生存率。
划重点:
● 机器人+AI 协同:NHS England 试验利用 AI 识别 6mm 微小病灶,并配合机器人摄像头进行高精度活检,显著提升早期诊断率。
● 流程极速简化:新技术可将数周的检查周期缩短为 30 分钟的一次性操作,减少患者不确定性并避免更具破坏性的手术。
● 覆盖高危人群:NHS 承诺 2030 年前实现烟民及前烟民全覆盖筛查,目标是在 2035 年前发现 2.3 万例早期肺癌病例。
via AI新闻资讯 (author: AI Base)
英国国家医疗服务体系(NHS)正迈出抗击癌症的关键一步。 1 月 26 日,NHS England 宣布将启动一项结合人工智能(AI)与机器人技术的临床试验,旨在加速英国最致命癌症——肺癌的早期发现与诊断。
该试点项目在伦敦的 Guy's and St Thomas' 医院开展。 其核心技术包含两个关键环节:首先,AI 软件会深度扫描肺部影像,精准识别出直径小至 6 毫米(约米粒大小)的疑似癌变结节,这些细微病灶在传统筛查中极易被忽略; 随后,一台机器人驱动的微型摄像头将引导穿刺工具深入肺部,在极高精度下完成活检取样。
这项技术有望将长达数周的反复扫描与等待缩短为一次仅需 30 分钟的诊疗流程,极大减轻了患者的心理压力和侵入性手术风险。 与此同时,NHS 承诺到 2030 年,将为全英所有吸烟者及前吸烟者提供肺癌筛查。 据预测,这一系列举措到 2035 年将帮助诊断出 5 万例肺癌患者,其中近半数处于早期阶段,有望挽救数千人的生命。
肺癌目前在英国每年夺走约 3.3 万人的生命,且在贫困地区的发病率显著更高。 NHS 希望通过这种“未来式”的检测手段,打破健康不平等现状,通过更早的介入治疗提升整体生存率。
划重点:
● 机器人+AI 协同:NHS England 试验利用 AI 识别 6mm 微小病灶,并配合机器人摄像头进行高精度活检,显著提升早期诊断率。
● 流程极速简化:新技术可将数周的检查周期缩短为 30 分钟的一次性操作,减少患者不确定性并避免更具破坏性的手术。
● 覆盖高危人群:NHS 承诺 2030 年前实现烟民及前烟民全覆盖筛查,目标是在 2035 年前发现 2.3 万例早期肺癌病例。
via AI新闻资讯 (author: AI Base)
1月26日,致力于利用人工智能系统自动设计并改进 AI 芯片的初创公司Ricursive Intelligence宣布完成3亿美元融资,估值在成立短短两个月内飙升至 40亿美元。本轮融资由Lightspeed领投,NVentures(英伟达风险投资部门)、DST Global及Radical AI等跟投。
核心技术:用 AI 制造 AI 芯片
Ricursive由前谷歌研究员 Anna Goldie 和 Azalia Mirhoseini 创立。两名创始人此前开发的 AlphaChip 强化学习方法已被应用于谷歌四代 TPU 芯片的布局设计中。
● 自进化系统:Ricursive正在构建一种能够自动创建硅衬底层并加速芯片迭代的系统。
● 终极愿景:创始人认为,通过不断重复这种 AI 设计芯片的闭环过程,最终将有望实现通用人工智能(AGI)。
目前,AI 芯片设计自动化已成为资本新宠。除了Ricursive,由 Naveen Rao 创立的 Unconventional AI 去年底也以45亿美元估值获得了 a16z 领投的融资。
via AI新闻资讯 (author: AI Base)
算力巅峰对决!阿里发布 Qwen3-Max-Thinking,正面硬刚 GPT-5.2
当全球 AI 领域的目光都聚焦在硅谷时,阿里再次用实力向世界证明了中国推理模型的极限。2026年1月26日,阿里正式发布千问系列旗舰推理模型 Qwen3-Max-Thinking。这一模型的面世,不仅标志着千问家族的性能再次跨越,更凭借其在19项权威基准测试中的惊人表现,直接向 GPT-5.2和 Gemini3Pro 发起了冲击。
两大硬核创新:让推理更“聪明”,更“高效”
Qwen3-Max-Thinking的强悍不仅仅体现在参数量上,更源于两项核心技术突破:
自适应工具调用能力:该能力赋予了模型更强的“行动力”,目前已率先在Qwen Chat上线。模型能根据任务复杂度,自主判断并精准调用各类外部工具,让 AI 从“只会说”进化到“更会做”。
测试时扩展技术(Scaling Test-time):这是一项旨在提升推理性能的前沿技术。通过在测试阶段动态扩展算力资源,模型能够更深层次地拆解复杂逻辑,确保每一个输出都经过“深思熟虑”。
性能对标:国产大模型的“高光时刻”
在多维度性能评估中,Qwen3-Max-Thinking展示出了媲美全球顶尖模型的素质。在19项涵盖逻辑推理、数学能力、编程开发及多模态理解的权威基准测试中,其得分与 GPT-5.2、Gemini3Pro 等顶级闭源模型旗鼓相当,成功跻身世界第一梯队。
话题追踪:千问家族的“马年加速度”
回看阿里的 AI 进击之路,Qwen3系列的进化速度令人惊叹:
2025年9月:发布万亿参数规模的Qwen3-Max-Preview,奠定算力基础。
2025年11月:Qwen3-Max-Thinking 早期预览版亮相,开启推理模型探索。
2025年12月:推出全模态大模型Qwen3-Omni-Flash,实现实时流式响应。
2026年1月:旗舰推理模型正式落槌,标志着推理能力的全面成熟。
随着Qwen3-Max-Thinking的正式发布,AI 推理的商业化应用门槛将被进一步拉低。无论是在复杂的科研计算,还是在精细化的企业智能助理场景,这款“大脑”都将提供前所未有的动力。
via AI新闻资讯 (author: AI Base)
当全球 AI 领域的目光都聚焦在硅谷时,阿里再次用实力向世界证明了中国推理模型的极限。2026年1月26日,阿里正式发布千问系列旗舰推理模型 Qwen3-Max-Thinking。这一模型的面世,不仅标志着千问家族的性能再次跨越,更凭借其在19项权威基准测试中的惊人表现,直接向 GPT-5.2和 Gemini3Pro 发起了冲击。
两大硬核创新:让推理更“聪明”,更“高效”
Qwen3-Max-Thinking的强悍不仅仅体现在参数量上,更源于两项核心技术突破:
自适应工具调用能力:该能力赋予了模型更强的“行动力”,目前已率先在Qwen Chat上线。模型能根据任务复杂度,自主判断并精准调用各类外部工具,让 AI 从“只会说”进化到“更会做”。
测试时扩展技术(Scaling Test-time):这是一项旨在提升推理性能的前沿技术。通过在测试阶段动态扩展算力资源,模型能够更深层次地拆解复杂逻辑,确保每一个输出都经过“深思熟虑”。
性能对标:国产大模型的“高光时刻”
在多维度性能评估中,Qwen3-Max-Thinking展示出了媲美全球顶尖模型的素质。在19项涵盖逻辑推理、数学能力、编程开发及多模态理解的权威基准测试中,其得分与 GPT-5.2、Gemini3Pro 等顶级闭源模型旗鼓相当,成功跻身世界第一梯队。
话题追踪:千问家族的“马年加速度”
回看阿里的 AI 进击之路,Qwen3系列的进化速度令人惊叹:
2025年9月:发布万亿参数规模的Qwen3-Max-Preview,奠定算力基础。
2025年11月:Qwen3-Max-Thinking 早期预览版亮相,开启推理模型探索。
2025年12月:推出全模态大模型Qwen3-Omni-Flash,实现实时流式响应。
2026年1月:旗舰推理模型正式落槌,标志着推理能力的全面成熟。
随着Qwen3-Max-Thinking的正式发布,AI 推理的商业化应用门槛将被进一步拉低。无论是在复杂的科研计算,还是在精细化的企业智能助理场景,这款“大脑”都将提供前所未有的动力。
via AI新闻资讯 (author: AI Base)
阿里巴巴正式发布千问系列旗舰推理模型——Qwen3-Max-Thinking。该模型在复杂推理、事实知识及智能体能力等核心维度实现跨越式升级,号称总参数量已突破万亿大关。在多项权威基准测试中,其综合表现已能与 GPT-5.2-Thinking、Claude-Opus-4.5及 Gemini3Pro 等全球顶尖模型并驾齐驱。
Qwen3-Max-Thinking 采用了更为大规模的强化学习训练,并引入了“自适应工具调用”和“测试时扩展”两项核心创新技术。它不仅能像人类专家一样在思考的同时自主调用搜索、记忆和代码解释器,还显著降低了模型幻觉,使其在处理真实世界的复杂任务时更加智能、流畅。
目前,Qwen3-Max-Thinking 已正式上线 Qwen Chat 供用户交互体验,其 API(模型名称:qwen3-max-2026-01-23)也已同步向开发者开放。
划重点:
● 🚀 性能对标国际顶流:在19项权威测试中,Qwen3-Max-Thinking 的性能媲美 GPT-5.2和 Claude-4.5,处于国际领先水平。
● 🤖 原生智能体能力:模型具备自适应工具调用能力,可根据任务需求自主选择搜索引擎或代码解释器,实现“边用边思”。
● 🧠 万亿级参数推理:通过更大规模的强化学习与测试时扩展(Test-Time Scaling)技术,大幅提升了在科学知识与数学推理等高难度领域的表现。
via AI新闻资讯 (author: AI Base)
当 AI 聊天机器人还停留在“你问我答”的初级阶段时,Anthropic已经决定打破这面“次元壁”。当地时间周一,Anthropic正式为 Claude 上线了一项颠覆性的功能:交互式应用集成。
这意味着用户无需再频繁切换标签页,直接在 Claude 的对话界面就能调动外部办公工具处理实战任务。
办公全家桶上线:Claude 变身“超级助工”
首批上线的应用阵营覆盖了企业办公的核心环节,包括Slack、Canva、Figma、Box和Clay,而Salesforce的集成也已在路上。
深度权限整合:开启授权后,Claude 可以在已登录环境下直接代执行任务,比如发送一条Slack消息、从Box提取云端文件,或者在Canva中协助生成图表。
协同增效:Anthropic认为,内容设计、数据分析等任务更适合可视化操作,将 Claude 的智能与这些专业界面结合,能极大缩短构思到迭代的周期。
技术基石:MCP 协议的生态威力
此次发布在功能逻辑上与OpenAI的ChatGPT“Apps” 系统异曲同工,其背后都支撑着同一套开放标准——模型上下文协议(MCP)。
统一标准:该协议由Anthropic在2024年推出,并在2025年底新增了对“应用”的支持,旨在让不同的 AI 模型都能无缝对接第三方服务。
未来潜力:这套体系将与近期上线的Claude Cowork代理工具产生强烈的化学反应,未来系统有望在无需人工干预的情况下,跨平台完成批量数据处理或复杂的项目协作流程。
安全第一:如何开启“AI 代办”模式?
目前,这项交互式应用功能面向 Claude Pro、Max、Team 和 Enterprise 订阅用户开放,符合条件的用户可前往claude.ai/directory进行管理。
安全贴士:
由于系统具备“代理性”,可能出现难以预判的行为,Anthropic强烈建议用户:
避免授予财务文件或账号凭证等敏感权限;
优先为 Claude 创建专门的工作文件夹,而非开放整个目录;
密切关注 Cowork 的实际操作过程,降低安全风险。
via AI新闻资讯 (author: AI Base)
微软发布AI芯片Maia200,加速摆脱对英伟达依赖
微软正式推出其第二代自研人工智能芯片Maia200,旨在进一步提升 Azure 云服务的 AI 推理效率,并削减对英伟达(NVIDIA)昂贵 GPU 的采购依赖。
这款由台积电代工的Maia200芯片目前已开始向微软位于爱荷华州的数据中心发货,随后将部署至凤凰城地区。微软云计算与 AI 主管 Scott Guthrie 表示,该芯片是微软迄今为止部署的“最高效的推理系统”。它将首先交付给微软内部的超级 AI 团队,用于生成高质量数据以训练下一代模型,并驱动面向企业的Copilot助手及OpenAI的最新模型。
微软强调,Maia200在特定 AI 任务中的表现优于谷歌和亚马逊云服务的同类自研半导体。为了确保在算力赛道的持续领先,微软披露已在进行下一代芯片Maia300的设计。此外,作为与 OpenAI 合作协议的一部分,微软在自研受阻时仍拥有使用该初创公司初期芯片设计的权利,这为其底层算力架构提供了“双重保险”。
via AI新闻资讯 (author: AI Base)
微软正式推出其第二代自研人工智能芯片Maia200,旨在进一步提升 Azure 云服务的 AI 推理效率,并削减对英伟达(NVIDIA)昂贵 GPU 的采购依赖。
这款由台积电代工的Maia200芯片目前已开始向微软位于爱荷华州的数据中心发货,随后将部署至凤凰城地区。微软云计算与 AI 主管 Scott Guthrie 表示,该芯片是微软迄今为止部署的“最高效的推理系统”。它将首先交付给微软内部的超级 AI 团队,用于生成高质量数据以训练下一代模型,并驱动面向企业的Copilot助手及OpenAI的最新模型。
微软强调,Maia200在特定 AI 任务中的表现优于谷歌和亚马逊云服务的同类自研半导体。为了确保在算力赛道的持续领先,微软披露已在进行下一代芯片Maia300的设计。此外,作为与 OpenAI 合作协议的一部分,微软在自研受阻时仍拥有使用该初创公司初期芯片设计的权利,这为其底层算力架构提供了“双重保险”。
via AI新闻资讯 (author: AI Base)
近日,《华盛顿邮报》的科技专栏作家 Geoffrey A. Fowler 分享了一次颇为惊险的经历,他将自己十年来在 Apple Watch 上记录的健康数据导入到 OpenAI 最新推出的 ChatGPT Health 功能中,结果却被错误地判定心脏健康为 “不及格”(F)。这一结果让 Fowler 感到恐慌,他随即联系了医生进行进一步检查。
经过详细的医疗评估,医生明确表示 Fowler 的心脏健康状况极佳,心脏病发作的风险非常低,甚至不需要进行额外的有氧适能测试。这一番反转让 Fowler 松了口气,但同时也引发了他对 AI 健康评估准确性的质疑。
深入分析后,Fowler 发现 ChatGPT 的误判主要源于对数据的错误解读。AI 将 Apple Watch 记录的 VO2max(最大摄氧量)视为绝对准确的医疗数据,而实际上,苹果公司早已说明这一数据仅为 “估算值”,其主要用途在于跟踪健康趋势,而非提供临床诊断。此外,Fowler 在更换新款 Apple Watch 后,由于传感器升级而导致的静息心率基准变化,AI 也错误地将其解读为生理机能的显著变化,完全忽略了硬件更新的关键因素。
更为棘手的是,ChatGPT Health 在反馈结果时表现出明显的不稳定性。当 Fowler 多次询问同一健康问题时,AI 的评分在 “F” 到 “B” 之间剧烈波动,令人难以置信。此外,该系统似乎还出现了 “健忘症”,在对话中多次遗忘 Fowler 的性别和年龄等基本信息,甚至在拥有最近血液检测报告的情况下,依然选择性地忽略这些重要的临床证据。
Fowler 的这一经历提醒我们,在利用 AI 技术进行健康评估时,务必保持警惕,毕竟 AI 的判断并非总是可靠。
via AI新闻资讯 (author: AI Base)