https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
告别“性能黑盒”:Windows 11 任务管理器正式支持 NPU 监测
微软近日在 Windows 11 开发版更新中,针对任务管理器推出了一项重磅升级。这项更新终于补齐了硬件监控的最后一块拼图,正式加入了对神经网络处理单元(NPU)的实时监测功能。
随着 AI PC 概念的普及,NPU 已成为处理人工智能任务的核心硬件。此前用户无法直观查看 NPU 的运行状态,而此次升级让这一专用芯片的负载情况变得透明可见。
在最新的 26300.8142 预览版本中,任务管理器的进程、用户及详细信息页面均新增了 NPU 列。用户不仅能查看 NPU 的实时占用率,还能深入了解各类程序对专用内存与共享内存的具体消耗。
不仅如此,微软还进一步细化了监测维度,性能页面现在可以完整展示显卡内置的神经网络引擎活动。这意味着系统内所有与 AI 相关的运行轨迹,都将被任务管理器一网打尽。
任务管理器的这一进化,标志着 NPU 已正式进入主流硬件性能评价体系。对于开发者和极客用户而言,这不仅是数据的增加,更是对 AI 应用能耗与效率进行精准调优的基石。
目前该功能主要面向预览体验成员开放,大规模推送仍需时日。可以预见的是,随着 NPU 监测的普及,未来的 Windows 系统将更深度地围绕 AI 硬件生态进行体验重构。
via AI新闻资讯 (author: AI Base)
微软近日在 Windows 11 开发版更新中,针对任务管理器推出了一项重磅升级。这项更新终于补齐了硬件监控的最后一块拼图,正式加入了对神经网络处理单元(NPU)的实时监测功能。
随着 AI PC 概念的普及,NPU 已成为处理人工智能任务的核心硬件。此前用户无法直观查看 NPU 的运行状态,而此次升级让这一专用芯片的负载情况变得透明可见。
在最新的 26300.8142 预览版本中,任务管理器的进程、用户及详细信息页面均新增了 NPU 列。用户不仅能查看 NPU 的实时占用率,还能深入了解各类程序对专用内存与共享内存的具体消耗。
不仅如此,微软还进一步细化了监测维度,性能页面现在可以完整展示显卡内置的神经网络引擎活动。这意味着系统内所有与 AI 相关的运行轨迹,都将被任务管理器一网打尽。
任务管理器的这一进化,标志着 NPU 已正式进入主流硬件性能评价体系。对于开发者和极客用户而言,这不仅是数据的增加,更是对 AI 应用能耗与效率进行精准调优的基石。
目前该功能主要面向预览体验成员开放,大规模推送仍需时日。可以预见的是,随着 NPU 监测的普及,未来的 Windows 系统将更深度地围绕 AI 硬件生态进行体验重构。
via AI新闻资讯 (author: AI Base)
美图AI开放平台发布Meitu CLI,首批8大影像能力接入OpenClaw生态
3月31日,美图AI开放平台正式发布Meitu CLI工具,标志着其核心影像能力实现标准化封装。首批美图AI Skills已同步登陆ClawHub并全面接入OpenClaw龙虾生态,开放包括AI图像、视频、设计在内的8种场景化影像能力。
此次发布的核心在于通过“开箱即用、按量付费”的轻量化模式,打破了高阶视觉生产的技术门槛,使“一人公司”与初创团队能够以极低成本构建专业级视觉内容生产工作流。
技术层面,Meitu CLI将美图长年积累的影像算法解构为一系列可调用、可组合、可复用的标准化模块,极大地提升了跨模态能力的调用效率。结合OpenClaw的云端集成特性,该工具彻底摆脱了人工在岗的物理限制,支持移动端远程指令触发与事件驱动的自动化流程。例如,在电商场景下,ERP系统上新可自动诱发Meitu CLI生成并同步商品图,实现了从创作到分发的全链路去人工化。
在当前大模型应用竞速阶段,美图此举反映了AI工具从“单一功能”向“工程化集成”转化的趋势。通过降低专业影像技术的工程化难度,美图正在通过能力拆解与生态接入,抢占微型企业及个体开发者的生产力底座市场,这不仅验证了AI赋能B端业务的新路径,也为影像行业的工业化协作提供了标准化范本。
via AI新闻资讯 (author: AI Base)
3月31日,美图AI开放平台正式发布Meitu CLI工具,标志着其核心影像能力实现标准化封装。首批美图AI Skills已同步登陆ClawHub并全面接入OpenClaw龙虾生态,开放包括AI图像、视频、设计在内的8种场景化影像能力。
此次发布的核心在于通过“开箱即用、按量付费”的轻量化模式,打破了高阶视觉生产的技术门槛,使“一人公司”与初创团队能够以极低成本构建专业级视觉内容生产工作流。
技术层面,Meitu CLI将美图长年积累的影像算法解构为一系列可调用、可组合、可复用的标准化模块,极大地提升了跨模态能力的调用效率。结合OpenClaw的云端集成特性,该工具彻底摆脱了人工在岗的物理限制,支持移动端远程指令触发与事件驱动的自动化流程。例如,在电商场景下,ERP系统上新可自动诱发Meitu CLI生成并同步商品图,实现了从创作到分发的全链路去人工化。
在当前大模型应用竞速阶段,美图此举反映了AI工具从“单一功能”向“工程化集成”转化的趋势。通过降低专业影像技术的工程化难度,美图正在通过能力拆解与生态接入,抢占微型企业及个体开发者的生产力底座市场,这不仅验证了AI赋能B端业务的新路径,也为影像行业的工业化协作提供了标准化范本。
via AI新闻资讯 (author: AI Base)
近期,AI 开发者社区迎来重磅更新,OpenAI 在 GitHub 上正式发布了名为codex-plugin-cc的开源项目。这款插件允许开发者在 Anthropic 推出的命令行开发工具 Claude Code 中,直接调用 OpenAI 的 Codex 模型能力。
这种“跨厂牌”的集成打破了以往大模型工具之间的生态壁垒,让开发者无需切换环境即可同时调用两家巨头的技术优势。通过简单的指令配置,Claude Code 瞬间化身为集两家之长的全能编程助手。
在该插件的赋能下,用户可以通过
/codex:review 指令发起标准的只读代码审查,获取来自 Codex 的专业改进建议。这种双重校验机制能有效捕捉单一模型可能遗漏的逻辑漏洞,为代码质量加上“双保险”。更具特色的是其“对抗性审查”功能,开发者可以利用
/codex:adversarial-review 主动要求 Codex 挑战现有的设计决策。这种模式专门用于压测系统架构的合理性,通过“找茬”视角挖掘潜在的性能瓶颈或安全隐患。此外,插件还引入了任务委派机制,允许用户通过
/codex:rescue 将复杂的调试或修复任务转交给 Codex 子代理处理。这种协作模式实现了任务的自动分流,让主模型与辅助模型在各自擅长的领域各司其职。github:https://github.com/openai/codex-plugin-cc
via AI新闻资讯 (author: AI Base)
近期,内存市场可能迎来转折点。在经历了一轮价格飙升后,分析师注意到市场出现了稳定迹象。据报道,大型科技公司需求下降,可能导致DRAM价格逐步回落。
此前,内存价格大幅上涨的重要原因之一是OpenAI的大规模采购——该公司向三星和SK海力士订购了约90万片DRAM晶圆。正是这类需求成为导致内存短缺和价格飙升的关键因素之一。
然而,消息人士称,OpenAI正重新评估其战略并削减开支。具体措施包括放弃部分计划、关闭一些项目、重新评估与甲骨文等公司的数十亿美元协议,以及减少对数据中心基础设施的投资。类似案例还包括迪士尼,在关闭SORA项目后放弃了10亿美元的投资计划。
与此同时,人工智能领域的其他竞争者,如以Claude产品闻名的Anthropic,也对市场形成了额外压力。在此背景下,专家认为内存市场正进入降温阶段,短期内有望实现价格稳定并逐步回落。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:3DMGame)
近日,DeepMind创始人德米斯・哈萨比斯坦言,其研发的超级人工智能存在灭绝人类的风险,而当前AI发展竞赛已进入无法停止的状态,人类难以通过外部治理手段有效管控。他彻底放弃此前依赖制度、伦理委员会约束AI的构想,承认治理结构在关键决策中难以发挥作用,只能依靠自身争取话语权来把控AI安全走向。
哈萨比斯一直是AI安全的坚定倡导者,早年曾设想通过独立监督、秘密研发等方式打造绝对安全的超级智能。
2014年将DeepMind出售给Google时,还明确要求保留AI安全独立决策权、设立外部监督委员会并禁止军事应用。
但这些安全构想接连落空,马斯克参与相关集会后转而创立OpenAI,打破了单一主体管控AI的设想,后续与Google的治理权谈判也以失败告终。
2022年ChatGPT的出现,彻底打乱了AI研发节奏,Google陷入竞争焦虑,DeepMind与Google大脑合并,安全规范让位于研发速度,此前的安全防线逐步失效。
哈萨比斯由此认清现实,在商业竞争与技术竞赛压力下,依附于商业巨头的非营利治理机制难以存续。
如今哈萨比斯转变思路,核心主张是让自己占据核心决策位置,凭借对AI风险的敬畏之心,在关键节点把控技术方向。
他一边推进Gemini等模型研发,一边坚守安全底线,试图以个人影响力降低AI失控风险。
业内分析认为,这一转变折射出全球AI竞赛的残酷现状,统一治理难以实现,AI安全窗口持续收窄,人类正面临关乎文明存续的巨大挑战。
via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
意外还是预演?苹果国行 AI 凌晨短暂“偷跑”,自曝内置百度文心大模型
苹果国行版 AI 的面纱,似乎在一次“系统意外”中被提前揭开了。
3月31日凌晨,不少 iPhone 用户在社交平台反馈,其系统设置中突然出现了可开启的“Apple 智能与 Siri”选项。这一突如其来的更新引发了关于“苹果国行 AI 正式上线”的热议,但仅数小时后,该功能便被苹果官方撤回并下线。
深夜“偷跑”:新 Siri 亲口承认“我是文心”
在功能短暂开放期间,部分抢先体验的用户与新版 Siri 进行了深度对话,并挖出了核心商业机密:
身份自曝: 当用户询问新版 Siri 使用的是什么大模型时,AI 明确回复称其使用的是由 百度在线网络技术(北京)有限公司 开发的“文心大模型”。
功能撤回: 知名科技记者马克·古尔曼(Mark Gurman)随后发文证实,此次功能出现属于“意外上线”。目前苹果已迅速下线了该选项,官方并未发布任何相关的系统更新说明。
落地困局:合规准备已就绪,发布尚无期
尽管功能短暂露面,但苹果国行 AI 的全面普及仍面临政策性挑战:
准备就绪: 消息人士透露,苹果国行 AI 在技术层面已准备就绪数月,并完成了与本土大模型(如文心一言)的适配工作。
监管卡点: 古尔曼指出,该功能迟迟未能发布,核心原因在于尚未获得监管部门的最终批准。在相关合规流程走完之前,苹果尚无明确的发布计划。
行业背景:苹果 AI 的“入华”折衷方案
由于 OpenAI 的 ChatGPT 无法在中国境内提供服务,苹果在华推行 Apple Intelligence 必须寻找本土合作伙伴:
强强联手: 此次“偷跑”事件侧面印证了此前关于“苹果与百度达成 AI 合作”的传闻。
技术融合: 苹果将利用自研模型处理端侧简单任务,而将需要云端算力的复杂任务交由 百度文心 等本土通过备案的大模型处理。
结语:距离“果粉”用上 AI 还有多远?
从凌晨的短暂惊艳到迅速消失,苹果国行 AI 的这次“偷跑”更像是一次压力测试。虽然官方依然保持沉默,但新 Siri 与 百度文心大模型 的深度绑定已是不争的事实。对于广大中国用户而言,硬件已经备好,剩下的只有对监管准入与正式推送的漫长等待。
via AI新闻资讯 (author: AI Base)
苹果国行版 AI 的面纱,似乎在一次“系统意外”中被提前揭开了。
3月31日凌晨,不少 iPhone 用户在社交平台反馈,其系统设置中突然出现了可开启的“Apple 智能与 Siri”选项。这一突如其来的更新引发了关于“苹果国行 AI 正式上线”的热议,但仅数小时后,该功能便被苹果官方撤回并下线。
深夜“偷跑”:新 Siri 亲口承认“我是文心”
在功能短暂开放期间,部分抢先体验的用户与新版 Siri 进行了深度对话,并挖出了核心商业机密:
身份自曝: 当用户询问新版 Siri 使用的是什么大模型时,AI 明确回复称其使用的是由 百度在线网络技术(北京)有限公司 开发的“文心大模型”。
功能撤回: 知名科技记者马克·古尔曼(Mark Gurman)随后发文证实,此次功能出现属于“意外上线”。目前苹果已迅速下线了该选项,官方并未发布任何相关的系统更新说明。
落地困局:合规准备已就绪,发布尚无期
尽管功能短暂露面,但苹果国行 AI 的全面普及仍面临政策性挑战:
准备就绪: 消息人士透露,苹果国行 AI 在技术层面已准备就绪数月,并完成了与本土大模型(如文心一言)的适配工作。
监管卡点: 古尔曼指出,该功能迟迟未能发布,核心原因在于尚未获得监管部门的最终批准。在相关合规流程走完之前,苹果尚无明确的发布计划。
行业背景:苹果 AI 的“入华”折衷方案
由于 OpenAI 的 ChatGPT 无法在中国境内提供服务,苹果在华推行 Apple Intelligence 必须寻找本土合作伙伴:
强强联手: 此次“偷跑”事件侧面印证了此前关于“苹果与百度达成 AI 合作”的传闻。
技术融合: 苹果将利用自研模型处理端侧简单任务,而将需要云端算力的复杂任务交由 百度文心 等本土通过备案的大模型处理。
结语:距离“果粉”用上 AI 还有多远?
从凌晨的短暂惊艳到迅速消失,苹果国行 AI 的这次“偷跑”更像是一次压力测试。虽然官方依然保持沉默,但新 Siri 与 百度文心大模型 的深度绑定已是不争的事实。对于广大中国用户而言,硬件已经备好,剩下的只有对监管准入与正式推送的漫长等待。
via AI新闻资讯 (author: AI Base)
预言 2026:OpenClaw 创始人称今年将成为通用 AI 代理元年
近日,开源 AI 项目 OpenClaw 的创始人在技术峰会上语出惊人,预言 2026 年将正式开启“通用 AI 代理”的爆发纪元。他认为 AI 正在从单纯的聊天机器人,进化为能够自主处理复杂工作流的智能数字员工。
这种转变意味着 AI 不再仅仅是信息的搬运工,而是具备了跨平台操作和逻辑拆解能力的执行者。在 OpenClaw 的技术蓝图中,AI 代理可以像人类一样操作软件、管理日程并协同多项复杂任务。
行业内对“通用代理”的定义一直存在争议,但 2026 年的一系列技术突破显然正让这一概念具象化。从底层架构的优化到多模态交互的成熟,AI 已经能够精准理解模糊指令并转化为实际的生产力输出。
AIbase 视角认为,通用 AI 代理的崛起将彻底重塑现有的 SaaS 软件格局与个人办公习惯。当 AI 能够自主调用各种工具完成闭环工作时,传统的人机交互界面可能会逐渐退居幕后。
尽管技术前景广阔,但代理权的过度下放也引发了关于安全与伦理的深度讨论。如何确保 AI 代理在自主决策时不偏离人类预设的轨道,将是今年技术社区攻克的核核心难题。
站在 2026 年的起点上,我们或许正在见证从“人工辅助”向“人工监督”的本质跨越。OpenClaw 的预言能否成真,取决于这些智能代理能否在现实的复杂场景中证明自己的可靠性。
via AI新闻资讯 (author: AI Base)
近日,开源 AI 项目 OpenClaw 的创始人在技术峰会上语出惊人,预言 2026 年将正式开启“通用 AI 代理”的爆发纪元。他认为 AI 正在从单纯的聊天机器人,进化为能够自主处理复杂工作流的智能数字员工。
这种转变意味着 AI 不再仅仅是信息的搬运工,而是具备了跨平台操作和逻辑拆解能力的执行者。在 OpenClaw 的技术蓝图中,AI 代理可以像人类一样操作软件、管理日程并协同多项复杂任务。
行业内对“通用代理”的定义一直存在争议,但 2026 年的一系列技术突破显然正让这一概念具象化。从底层架构的优化到多模态交互的成熟,AI 已经能够精准理解模糊指令并转化为实际的生产力输出。
AIbase 视角认为,通用 AI 代理的崛起将彻底重塑现有的 SaaS 软件格局与个人办公习惯。当 AI 能够自主调用各种工具完成闭环工作时,传统的人机交互界面可能会逐渐退居幕后。
尽管技术前景广阔,但代理权的过度下放也引发了关于安全与伦理的深度讨论。如何确保 AI 代理在自主决策时不偏离人类预设的轨道,将是今年技术社区攻克的核核心难题。
站在 2026 年的起点上,我们或许正在见证从“人工辅助”向“人工监督”的本质跨越。OpenClaw 的预言能否成真,取决于这些智能代理能否在现实的复杂场景中证明自己的可靠性。
via AI新闻资讯 (author: AI Base)
近日,在开发者群体中备受推崇的 AI 网关初创公司 LiteLLM 正式对外宣布,将彻底移除其平台中极具争议的辅助工具 Delve。此举旨在回应社区对数据隐私及模型透明度的强烈质疑,试图通过“断臂求生”来挽回核心用户的信任。
作为连接开发者与多种大模型的关键桥梁,LiteLLM 此前引入 Delve 原意是为了优化提示词分析与响应速度。然而,不少技术专家指出,Delve 在处理敏感数据时存在暗箱操作风险,其底层逻辑与主流开源精神背道而驰。
面对愈演愈烈的舆论压力,LiteLLM 创始人公开承认,在筛选合作伙伴时未能进行足够严谨的安全评估。为了维护平台中立性,团队决定迅速剔除所有关联代码,并承诺未来将转向更加透明、可审计的开源替代方案。
AIbase 视角认为,此次“割席”事件揭示了 AI 中间层架构在追求效率与保障安全之间的激烈冲突。对于依赖第三方网关的企业而言,上游供应商的每一次功能调整,都可能直接关乎其业务的合规命脉。
在当前 AI 生态圈中,单纯的“好用”已不足以支撑起一个平台的长远发展,底层逻辑的清白透明正成为新的准入门槛。LiteLLM 的果断止损虽短期内造成了功能波折,但从长远看,这是构建技术信任护城河的必然选择。
这场风波也给所有 AI 基础设施初创公司敲响了警钟:在算法黑盒层出不穷的今天,任何模糊地带都可能成为埋下品牌危机的导火索。只有坚持高度的工程透明度,才能在群雄逐鹿的 AI 接入层竞赛中站稳脚跟。
via AI新闻资讯 (author: AI Base)
加州硬刚特朗普:拟推行全美最严 AI 监管新规
加利福尼亚州政府近日宣布,将无视特朗普政府放宽技术约束的号召,执意推进一系列严苛的人工智能监管法案。此举旨在填补联邦层面在 AI 安全治理上的真空,确保前沿技术开发不会对公众利益造成实质性损害。
作为全球 AI 创新的心脏,加州的这一表态无疑是在向白宫发出的直接挑战,进一步加剧了州政府与联邦在技术主权上的博弈。加州官员明确表示,即便面临来自华盛顿的压力,保护公民隐私与防止算法歧视仍是该州的底线。
此次拟议的新规涵盖了从模型训练透明度到灾难性风险预防的多个维度,要求顶级 AI 企业必须提交详细的合规性报告。这种高标准的准入门槛,被外界视为加州在试图定义全美甚至全球的人工智能治理范式。
特朗普政府此前曾多次批评过度的监管会削弱美国 AI 产业的国际竞争力,主张通过去中心化的方式释放创新活力。然而,加州立法者认为,缺乏约束的算法如同“脱缰野马”,必须通过立法手段建立起必要的安全护栏。
AIbase 视角观察到,这种“一国两制”式的监管冲突,可能会迫使科技巨头在不同州边界上面临完全不同的运营成本。对于开发者而言,如何在政治博弈的夹缝中寻求合规,将成为 2026 年最具挑战性的命题。
这场围绕 AI 解释权的争夺战才刚刚拉开序幕,加州的强硬姿态或许会引发其他民主党执政州的效仿。在联邦法律统一之前,美国 AI 行业或将进入一个政策高度碎片化且充满不确定性的震荡期。
via AI新闻资讯 (author: AI Base)
加利福尼亚州政府近日宣布,将无视特朗普政府放宽技术约束的号召,执意推进一系列严苛的人工智能监管法案。此举旨在填补联邦层面在 AI 安全治理上的真空,确保前沿技术开发不会对公众利益造成实质性损害。
作为全球 AI 创新的心脏,加州的这一表态无疑是在向白宫发出的直接挑战,进一步加剧了州政府与联邦在技术主权上的博弈。加州官员明确表示,即便面临来自华盛顿的压力,保护公民隐私与防止算法歧视仍是该州的底线。
此次拟议的新规涵盖了从模型训练透明度到灾难性风险预防的多个维度,要求顶级 AI 企业必须提交详细的合规性报告。这种高标准的准入门槛,被外界视为加州在试图定义全美甚至全球的人工智能治理范式。
特朗普政府此前曾多次批评过度的监管会削弱美国 AI 产业的国际竞争力,主张通过去中心化的方式释放创新活力。然而,加州立法者认为,缺乏约束的算法如同“脱缰野马”,必须通过立法手段建立起必要的安全护栏。
AIbase 视角观察到,这种“一国两制”式的监管冲突,可能会迫使科技巨头在不同州边界上面临完全不同的运营成本。对于开发者而言,如何在政治博弈的夹缝中寻求合规,将成为 2026 年最具挑战性的命题。
这场围绕 AI 解释权的争夺战才刚刚拉开序幕,加州的强硬姿态或许会引发其他民主党执政州的效仿。在联邦法律统一之前,美国 AI 行业或将进入一个政策高度碎片化且充满不确定性的震荡期。
via AI新闻资讯 (author: AI Base)
外卖员变身“AI 喂粉员”?DoorDash 动员 800 万骑手为机器人采集数据
当你在为生计奔波送餐时,你可能也在无意中成为了顶尖 AI 模型的“导师”。
据媒体报道,美国外送巨头DoorDash近期推出了一款名为“Tasks”的独立应用。这款应用允许其平台下超过 800万名 外卖员在送餐之余,通过完成简单的数字化任务来赚取额外报酬。
长尾场景克星:让骑手采集“真实物理世界”
DoorDash, Inc. 此举的核心目的并非简单的业务扩张,而是为了解决 AI 训练中的核心痛点——高质量真实场景数据的匮乏:
任务多样化: 骑手们通过拍摄特定的街景、录制日常对话、记录行走或交付动作等,为 AI 提供最接地气的素材。
攻克长尾场景: 相比于实验室模拟,分布在全球各地的800万骑手能深入大街小巷,低成本采集到大量稀缺的、真实的物理世界“长尾场景”数据。
技术闭环:为配送机器人 Dot 铺路
这些由骑手们“喂”出来的数据,将直接流向DoorDash的 AI 实验室:
模型进化: 数据将用于优化其配送机器人 Dot 的视觉识别与路径规划能力。
落地加速: 随着真实世界操作数据的不断累积,自动配送机器人在复杂环境下的生存能力将得到显著提升,推动自动配送在更多地区从实验室走向写字楼和社区。
行业前瞻:外卖员会被 AI 取代吗?
尽管DoorDash正在加速自动化的步伐,但行业专家认为,短期内外卖员的角色依然不可替代:
复杂环境处理: 在处理最后100米的入户交付、应对突发交通状况等方面,人类的灵活性依然远超当前的机器人。
角色转型: 骑手正在从单纯的“体力劳动者”向“AI 训练师”转型,通过与技术的协同实现价值重构。
结语:送餐路上的“数据矿工”
从大街小巷的穿梭者到 AI 模型的“喂粉员”,DoorDash正在利用其庞大的骑手网络构建一道难以逾越的技术护城河。当800万骑手的日常动作转化为驱动机器人的算法逻辑,一场关于“人机协同”的效率革命正在外卖行业悄然上演。
via AI新闻资讯 (author: AI Base)
当你在为生计奔波送餐时,你可能也在无意中成为了顶尖 AI 模型的“导师”。
据媒体报道,美国外送巨头DoorDash近期推出了一款名为“Tasks”的独立应用。这款应用允许其平台下超过 800万名 外卖员在送餐之余,通过完成简单的数字化任务来赚取额外报酬。
长尾场景克星:让骑手采集“真实物理世界”
DoorDash, Inc. 此举的核心目的并非简单的业务扩张,而是为了解决 AI 训练中的核心痛点——高质量真实场景数据的匮乏:
任务多样化: 骑手们通过拍摄特定的街景、录制日常对话、记录行走或交付动作等,为 AI 提供最接地气的素材。
攻克长尾场景: 相比于实验室模拟,分布在全球各地的800万骑手能深入大街小巷,低成本采集到大量稀缺的、真实的物理世界“长尾场景”数据。
技术闭环:为配送机器人 Dot 铺路
这些由骑手们“喂”出来的数据,将直接流向DoorDash的 AI 实验室:
模型进化: 数据将用于优化其配送机器人 Dot 的视觉识别与路径规划能力。
落地加速: 随着真实世界操作数据的不断累积,自动配送机器人在复杂环境下的生存能力将得到显著提升,推动自动配送在更多地区从实验室走向写字楼和社区。
行业前瞻:外卖员会被 AI 取代吗?
尽管DoorDash正在加速自动化的步伐,但行业专家认为,短期内外卖员的角色依然不可替代:
复杂环境处理: 在处理最后100米的入户交付、应对突发交通状况等方面,人类的灵活性依然远超当前的机器人。
角色转型: 骑手正在从单纯的“体力劳动者”向“AI 训练师”转型,通过与技术的协同实现价值重构。
结语:送餐路上的“数据矿工”
从大街小巷的穿梭者到 AI 模型的“喂粉员”,DoorDash正在利用其庞大的骑手网络构建一道难以逾越的技术护城河。当800万骑手的日常动作转化为驱动机器人的算法逻辑,一场关于“人机协同”的效率革命正在外卖行业悄然上演。
via AI新闻资讯 (author: AI Base)
蚂蚁灵波开源2.7T深度数据集,200万对真实样本,覆盖6款相机
3月31日,蚂蚁灵波科技正式开源大规模 RGB-D 深度数据集 LingBot-Depth-Dataset。该数据集包含300万对高质量样本,其中200万对来自真实场景采集、100万对由渲染生成,总规模达 2.71TB,覆盖6款主流深度相机,是目前开源社区中规模最大的真实场景 RGB-D 数据集。此次开源将为具身智能、空间感知和三维视觉等方向提供更丰富、更贴近真实应用的数据支撑。
(图说:LingBot-Depth-Dataset 数据样例。从上到下依次为 RGB 图像、传感器原始深度图和真值深度图。该数据集同时提供原始深度与真值深度信息,为相关模型在真实场景中的训练和评估提供有力支撑。)
长期以来,公开深度数据集普遍存在规模有限、真实场景覆盖不足、硬件设备单一等问题,不少数据以合成为主,与真实传感器在噪声、空洞和材质表现上存在较大差异,在很大程度上制约了相关模型在真实环境中的应用。
LingBot-Depth-Dataset 有效填补了空间感知领域的数据空白,特别是提供了大规模基于真实场景拍摄的数据。这套数据集每条样本均包含 RGB 图像、传感器原始深度图和真值深度图,可直接用于深度估计与深度补全任务的训练和评估。数据集覆盖 Orbbec335、335L 以及 Intel RealSense D405、D415、D435、D455共6款主流深度相机,有助于提升模型在不同设备和场景下的训练、适配与评估。
据介绍,蚂蚁灵波此前开源的高精度空间感知模型 LingBot-Depth,正是以该数据集作为核心训练数据。相比业界主流方法 PromptDA 与 PriorDA,LingBot-Depth 在室内场景中的深度预测误差降低超过70%,在稀疏深度补全等任务中的误差降低约47%。市售深度相机搭载该模型后,无需硬件升级,即可在透明玻璃、反光镜面、逆光等复杂场景下输出更完整、更平滑、边缘更清晰的深度图,且在部分场景中的表现超过业界顶级工业级深度相机。
对于高校、科研机构而言,这次开源不仅有助于降低数据采集与标注门槛,也有望加速相关技术从研究验证走向真实应用。随着机器人和具身智能加快进入实际场景,大规模、高质量、以真实采集为主体的空间感知数据集,无疑将成为行业持续进步的重要基础设施。
via AI新闻资讯 (author: AI Base)
3月31日,蚂蚁灵波科技正式开源大规模 RGB-D 深度数据集 LingBot-Depth-Dataset。该数据集包含300万对高质量样本,其中200万对来自真实场景采集、100万对由渲染生成,总规模达 2.71TB,覆盖6款主流深度相机,是目前开源社区中规模最大的真实场景 RGB-D 数据集。此次开源将为具身智能、空间感知和三维视觉等方向提供更丰富、更贴近真实应用的数据支撑。
(图说:LingBot-Depth-Dataset 数据样例。从上到下依次为 RGB 图像、传感器原始深度图和真值深度图。该数据集同时提供原始深度与真值深度信息,为相关模型在真实场景中的训练和评估提供有力支撑。)
长期以来,公开深度数据集普遍存在规模有限、真实场景覆盖不足、硬件设备单一等问题,不少数据以合成为主,与真实传感器在噪声、空洞和材质表现上存在较大差异,在很大程度上制约了相关模型在真实环境中的应用。
LingBot-Depth-Dataset 有效填补了空间感知领域的数据空白,特别是提供了大规模基于真实场景拍摄的数据。这套数据集每条样本均包含 RGB 图像、传感器原始深度图和真值深度图,可直接用于深度估计与深度补全任务的训练和评估。数据集覆盖 Orbbec335、335L 以及 Intel RealSense D405、D415、D435、D455共6款主流深度相机,有助于提升模型在不同设备和场景下的训练、适配与评估。
据介绍,蚂蚁灵波此前开源的高精度空间感知模型 LingBot-Depth,正是以该数据集作为核心训练数据。相比业界主流方法 PromptDA 与 PriorDA,LingBot-Depth 在室内场景中的深度预测误差降低超过70%,在稀疏深度补全等任务中的误差降低约47%。市售深度相机搭载该模型后,无需硬件升级,即可在透明玻璃、反光镜面、逆光等复杂场景下输出更完整、更平滑、边缘更清晰的深度图,且在部分场景中的表现超过业界顶级工业级深度相机。
对于高校、科研机构而言,这次开源不仅有助于降低数据采集与标注门槛,也有望加速相关技术从研究验证走向真实应用。随着机器人和具身智能加快进入实际场景,大规模、高质量、以真实采集为主体的空间感知数据集,无疑将成为行业持续进步的重要基础设施。
via AI新闻资讯 (author: AI Base)