https://t.me/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
📈主流AI服务状态页通知 | 🆕汇集全网ChatGPT/AI新闻 #AI #ChatGPT
🆓免费AI聊天 https://free.oaibest.com
✨BEST AI中转 https://api.oaibest.com 2.8折起 支持OpenAI, Claude code, Gemini,Grok, Deepseek, Midjourney, 文件上传分析
Buy ads: https://telega.io/c/AI_News_CN
地瓜机器人完成1.2亿美元B1轮融资,加速具身智能软硬件全栈研发
近日,具身智能计算基础设施领军企业地瓜机器人宣布完成1.2亿美元B1轮融资,此举标志着其在机器人全栈软硬件技术研发与产品迭代上进入加速阶段。
本轮融资由Synstellation Capital、滴滴、美团龙珠等头部产业资本领投,并吸引了北汽产投、九坤创投、芯联资本等多家战略及财务机构跟投,老股东高瓴创投、淡马锡旗下Vertex Growth、五源资本等悉数超额增持。自2025年完成A轮融资以来,公司在短短一年内累计融资额已达2.2亿美元(约合人民币15.17亿元),展现了资本市场对其“机器人界英伟达”定位的高度认可。
脱胎于地平线机器人事业部并于2024年独立运作的地瓜机器人,目前已构建起覆盖芯片、算法到软件的完善产品体系,算力布局跨越5至560TOPS,精准切入人形机器人、四足机器狗、物流AMR等多元化场景。通过与云鲸、影石Insta360、维他动力等行业头部客户的深度量产合作,地瓜机器人正纵向打通从前沿技术创新到大规模量产的链条。
在全球具身智能技术代际跃升的关键期,地瓜机器人致力于成为机器人时代的“Wintel”,其持续增强的端侧计算能力将为机器人规模化普及提供核心动力,进一步夯实全球机器人产业链的底层支撑基石。
via AI新闻资讯 (author: AI Base)
近日,具身智能计算基础设施领军企业地瓜机器人宣布完成1.2亿美元B1轮融资,此举标志着其在机器人全栈软硬件技术研发与产品迭代上进入加速阶段。
本轮融资由Synstellation Capital、滴滴、美团龙珠等头部产业资本领投,并吸引了北汽产投、九坤创投、芯联资本等多家战略及财务机构跟投,老股东高瓴创投、淡马锡旗下Vertex Growth、五源资本等悉数超额增持。自2025年完成A轮融资以来,公司在短短一年内累计融资额已达2.2亿美元(约合人民币15.17亿元),展现了资本市场对其“机器人界英伟达”定位的高度认可。
脱胎于地平线机器人事业部并于2024年独立运作的地瓜机器人,目前已构建起覆盖芯片、算法到软件的完善产品体系,算力布局跨越5至560TOPS,精准切入人形机器人、四足机器狗、物流AMR等多元化场景。通过与云鲸、影石Insta360、维他动力等行业头部客户的深度量产合作,地瓜机器人正纵向打通从前沿技术创新到大规模量产的链条。
在全球具身智能技术代际跃升的关键期,地瓜机器人致力于成为机器人时代的“Wintel”,其持续增强的端侧计算能力将为机器人规模化普及提供核心动力,进一步夯实全球机器人产业链的底层支撑基石。
via AI新闻资讯 (author: AI Base)
Anthropic 面向合作伙伴推出「Claude 认证架构师——基础」(CCA-F)认证考试,定位 301 级技术从业者,要求具备 Claude Agent SDK、Claude Code、Anthropic API 及 MCP 的实际开发经验。考试共 60 道题,涵盖五大核心能力领域,从六个生产场景中随机抽取四个作为考题背景,仅限一次作答机会,由 ProctorFree 提供在线监考;早期访问阶段前 5,000 名合作伙伴员工可免费参考,此后定价 99 美元,通过者将获得可在 LinkedIn 分享的 CCA-F 徽章。
Anthropic Courses
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
香港用户终于等到你!谷歌逐步解锁 Gemini 网页版:生成图像、音乐全开放
在经历了漫长的等待后,香港用户终于要和谷歌最强 AI 助手正面“握手”了。据有线新闻今日报道,谷歌 (Google) 已开始逐步向香港特别行政区用户开放其大语言模型 Gemini 的网页版应用。
作为谷歌倾力打造的多模态 AI,Gemini 此前因种种原因一直未对香港个人用户直接开放登录。此次“解锁”意味着,全港用户将能直接体验到这款集文字处理、图像生成、语音交互及复杂数据分析于一体的顶尖生产力工具。
根据谷歌方面的官方计划,本次开放将分阶段进行:
第一阶段: 逐步覆盖全港用户的网页端使用权限。
第二阶段: 未来将进一步涵盖 Gemini App 移动应用程序,让用户在手机上也能随时调用 AI 能力。
目前,香港用户可以使用 Gemini 处理日常办公琐事,或利用其多模态能力生成创意图像、多媒体内容以及编写音乐。虽然谷歌尚未透露此次开放的模型是否包含最新的 Gemini1.5Pro 系列,但这一举措无疑极大降低了香港开发者与创意工作者的技术门槛。
值得注意的是,随着Gemini的正式进场,香港市场的 AI 竞争格局将愈发白热化。此前,央视3·15晚会刚曝光了 AI 大模型被投毒的产业链,这提醒用户在享受谷歌带来的技术红利时,仍需保持对 AI 生成内容的审慎判别。当全球顶尖 AI 真正融入维港的日常生活,香港的数智化进程或将迎来新的加速点。
via AI新闻资讯 (author: AI Base)
在经历了漫长的等待后,香港用户终于要和谷歌最强 AI 助手正面“握手”了。据有线新闻今日报道,谷歌 (Google) 已开始逐步向香港特别行政区用户开放其大语言模型 Gemini 的网页版应用。
作为谷歌倾力打造的多模态 AI,Gemini 此前因种种原因一直未对香港个人用户直接开放登录。此次“解锁”意味着,全港用户将能直接体验到这款集文字处理、图像生成、语音交互及复杂数据分析于一体的顶尖生产力工具。
根据谷歌方面的官方计划,本次开放将分阶段进行:
第一阶段: 逐步覆盖全港用户的网页端使用权限。
第二阶段: 未来将进一步涵盖 Gemini App 移动应用程序,让用户在手机上也能随时调用 AI 能力。
目前,香港用户可以使用 Gemini 处理日常办公琐事,或利用其多模态能力生成创意图像、多媒体内容以及编写音乐。虽然谷歌尚未透露此次开放的模型是否包含最新的 Gemini1.5Pro 系列,但这一举措无疑极大降低了香港开发者与创意工作者的技术门槛。
值得注意的是,随着Gemini的正式进场,香港市场的 AI 竞争格局将愈发白热化。此前,央视3·15晚会刚曝光了 AI 大模型被投毒的产业链,这提醒用户在享受谷歌带来的技术红利时,仍需保持对 AI 生成内容的审慎判别。当全球顶尖 AI 真正融入维港的日常生活,香港的数智化进程或将迎来新的加速点。
via AI新闻资讯 (author: AI Base)
通义开源首个影视级配音大模型:AI 终于学会了“有感情地说话”
在 AIGC 横扫图像与文字领域后,影视行业的最后一个“人工堡垒”——配音,正在被阿里通义实验室攻破。3月16日,通义实验室正式发布并开源了全球首个支持影视级、多场景配音的多模态大模型 Fun-CineForge。
长期以来,AI 配音始终难以撕掉“机械感”和“播音腔”的标签。尤其在影视剧场景中,角色的情感爆发、环境音的杂糅以及口型同步,一直是 AI 难以逾越的鸿沟。而Fun-CineForge的出现,正是为了终结这一难题。
这款大模型采用了革命性的“数据+模型”一体化设计。除了模型本身,通义实验室还配套开放了一套高质量数据集的构建方法。这意味着,AI 不再是简单地读取文本,而是能够深度理解影视剧中的复杂语境,还原出细腻的情感起伏和多场景下的空间音效。
作为阿里通义家族的新成员,Fun-CineForge的开源属性极具杀伤力。它不仅为视频创作者提供了一个“影视级”的后期工具,更通过技术下放,让中短剧甚至个人创作者也能以极低成本完成高质量的跨语言译制。
从去年发布的Qwen3-Omni到如今的Fun-CineForge,通义系列正加速补齐多模态拼图的最后一块。当 AI 真正学会了“像人一样演戏”,影视翻译和后期制作的逻辑,或许将从此被彻底重写。目前,该模型及其数据集构建方案已在相关开源平台上线,这波“影视级 AI”的普及风暴,比我们想象中来得更快。
via AI新闻资讯 (author: AI Base)
在 AIGC 横扫图像与文字领域后,影视行业的最后一个“人工堡垒”——配音,正在被阿里通义实验室攻破。3月16日,通义实验室正式发布并开源了全球首个支持影视级、多场景配音的多模态大模型 Fun-CineForge。
长期以来,AI 配音始终难以撕掉“机械感”和“播音腔”的标签。尤其在影视剧场景中,角色的情感爆发、环境音的杂糅以及口型同步,一直是 AI 难以逾越的鸿沟。而Fun-CineForge的出现,正是为了终结这一难题。
这款大模型采用了革命性的“数据+模型”一体化设计。除了模型本身,通义实验室还配套开放了一套高质量数据集的构建方法。这意味着,AI 不再是简单地读取文本,而是能够深度理解影视剧中的复杂语境,还原出细腻的情感起伏和多场景下的空间音效。
作为阿里通义家族的新成员,Fun-CineForge的开源属性极具杀伤力。它不仅为视频创作者提供了一个“影视级”的后期工具,更通过技术下放,让中短剧甚至个人创作者也能以极低成本完成高质量的跨语言译制。
从去年发布的Qwen3-Omni到如今的Fun-CineForge,通义系列正加速补齐多模态拼图的最后一块。当 AI 真正学会了“像人一样演戏”,影视翻译和后期制作的逻辑,或许将从此被彻底重写。目前,该模型及其数据集构建方案已在相关开源平台上线,这波“影视级 AI”的普及风暴,比我们想象中来得更快。
via AI新闻资讯 (author: AI Base)
拒绝“套壳”:谷歌与 Accel 印度加速器从 4000 份申请中选出 5 家硬核初创公司
在审查了旗下印度人工智能加速器项目的 4000 多份申请后,谷歌与风险投资公司 Accel 正式公布了入选的 5 家初创企业。值得关注的是,尽管“人工智能封装器(Wrapper)”类的创意在申请中占据了绝大多数,但最终入选的名单中没有一家属于此类肤浅的“套壳”项目。
Accel 合伙人 Prayank Swaroop 表示,约 70% 的被拒申请仅仅是在现有模型之上叠加了一个简单的聊天机器人界面,而未能利用 AI 重新构思新的工作流程。此外,营销自动化和招聘工具等竞争过度、缺乏创新的领域也是被拒绝的重灾区。投资者目前更倾向于支持那些能够解决深层行业痛点、具备独特技术壁垒的企业。
此次入选的 5 家初创公司展现了极强的行业针对性,涵盖了从生命科学到工业自动化的多个前沿领域:
● K-Dense:开发 AI “副科学家”,旨在加速生物化学等领域的科研进程。
● Dodge.ai:为企业 ERP 系统打造自主智能体。
● Persistence Labs:专注于呼叫中心运营的语音 AI 技术。
● Zingroll:构建 AI 生成影视剧内容的平台。
● Level Plane:将 AI 应用于航空航天及汽车制造的工业自动化。
这些入选者将获得最高 200 万美元的资金支持,以及谷歌提供的 35 万美元计算资源。谷歌表示,该项目并不限制初创公司仅使用谷歌的模型,其核心目标是观察 AI 在现实复杂场景中的表现,并将相关反馈作为“飞轮”回馈给 Google DeepMind 团队,以推动未来模型的迭代升级。
via AI新闻资讯 (author: AI Base)
在审查了旗下印度人工智能加速器项目的 4000 多份申请后,谷歌与风险投资公司 Accel 正式公布了入选的 5 家初创企业。值得关注的是,尽管“人工智能封装器(Wrapper)”类的创意在申请中占据了绝大多数,但最终入选的名单中没有一家属于此类肤浅的“套壳”项目。
Accel 合伙人 Prayank Swaroop 表示,约 70% 的被拒申请仅仅是在现有模型之上叠加了一个简单的聊天机器人界面,而未能利用 AI 重新构思新的工作流程。此外,营销自动化和招聘工具等竞争过度、缺乏创新的领域也是被拒绝的重灾区。投资者目前更倾向于支持那些能够解决深层行业痛点、具备独特技术壁垒的企业。
此次入选的 5 家初创公司展现了极强的行业针对性,涵盖了从生命科学到工业自动化的多个前沿领域:
● K-Dense:开发 AI “副科学家”,旨在加速生物化学等领域的科研进程。
● Dodge.ai:为企业 ERP 系统打造自主智能体。
● Persistence Labs:专注于呼叫中心运营的语音 AI 技术。
● Zingroll:构建 AI 生成影视剧内容的平台。
● Level Plane:将 AI 应用于航空航天及汽车制造的工业自动化。
这些入选者将获得最高 200 万美元的资金支持,以及谷歌提供的 35 万美元计算资源。谷歌表示,该项目并不限制初创公司仅使用谷歌的模型,其核心目标是观察 AI 在现实复杂场景中的表现,并将相关反馈作为“飞轮”回馈给 Google DeepMind 团队,以推动未来模型的迭代升级。
via AI新闻资讯 (author: AI Base)
旧金山地下机器人格斗俱乐部:AI让人形机器人走向致命竞技
【AIbase】旧金山正在兴起一种新型地下娱乐——人形机器人格斗俱乐部。钢铁笼中,人形机器人在VR飞行员的远程操控下激烈对战,观众呐喊助威。这一奇特景象背后,是中国制造的硬件、美国搭建的竞技舞台,以及AI赋予机器人的致命能力。
地下机器人格斗:科技与娱乐的碰撞
据科技作家Ashlee Vance转发的报道,旧金山的地下机器人格斗俱乐部正在成为科技爱好者和极客们的新聚集地。在这些秘密举办的活动中,人形机器人被关在钢铁笼中进行激烈对抗。操控这些机器人的不是现场的操作员,而是通过VR设备进行远程操控的"飞行员"。
现场观众可以近距离观看这些机器人的对抗,感受金属碰撞的震撼。这种将高科技与娱乐 spectacle 结合的形式,正在吸引越来越多的关注。
中国制造,美国舞台
报道中特别提到,这些参与格斗的人形机器人硬件大多来自中国制造商。中国在人形机器人硬件制造领域的快速发展,为这些地下格斗俱乐部提供了坚实的技术基础。而美国则提供了展示这些技术的舞台和观众群体。
这种"中国制造硬件,美国搭建舞台"的模式,反映了全球AI和机器人产业链的协作与分工。
AI赋予致命能力
AI技术在这些机器人格斗中扮演着关键角色。通过AI算法,这些机器人能够做出更加灵活和精准的动作,让对抗更具观赏性。报道中提到"AI makes them lethal",暗示AI技术让这些机器人在格斗中展现出惊人的能力。
VR远程操控与AI自主决策的结合,代表了人机协作的新方向。操控者可以通过VR设备身临其境地感受机器人的视角,而AI则负责处理复杂的运动控制。
科技伦理与未来展望
虽然目前的机器人格斗更多是一种娱乐形式,但它也引发了关于AI和机器人技术应用的讨论。随着人形机器人技术的不断进步,类似的竞技活动可能会变得更加普遍。
科技作家Ashlee Vance对这一话题的关注,也反映了科技界对AI和机器人技术发展趋势的持续关注。
(本文综合X@ashleevance、X@jeffs2009等媒体报道)
via AI新闻资讯 (author: AI Base)
【AIbase】旧金山正在兴起一种新型地下娱乐——人形机器人格斗俱乐部。钢铁笼中,人形机器人在VR飞行员的远程操控下激烈对战,观众呐喊助威。这一奇特景象背后,是中国制造的硬件、美国搭建的竞技舞台,以及AI赋予机器人的致命能力。
地下机器人格斗:科技与娱乐的碰撞
据科技作家Ashlee Vance转发的报道,旧金山的地下机器人格斗俱乐部正在成为科技爱好者和极客们的新聚集地。在这些秘密举办的活动中,人形机器人被关在钢铁笼中进行激烈对抗。操控这些机器人的不是现场的操作员,而是通过VR设备进行远程操控的"飞行员"。
现场观众可以近距离观看这些机器人的对抗,感受金属碰撞的震撼。这种将高科技与娱乐 spectacle 结合的形式,正在吸引越来越多的关注。
中国制造,美国舞台
报道中特别提到,这些参与格斗的人形机器人硬件大多来自中国制造商。中国在人形机器人硬件制造领域的快速发展,为这些地下格斗俱乐部提供了坚实的技术基础。而美国则提供了展示这些技术的舞台和观众群体。
这种"中国制造硬件,美国搭建舞台"的模式,反映了全球AI和机器人产业链的协作与分工。
AI赋予致命能力
AI技术在这些机器人格斗中扮演着关键角色。通过AI算法,这些机器人能够做出更加灵活和精准的动作,让对抗更具观赏性。报道中提到"AI makes them lethal",暗示AI技术让这些机器人在格斗中展现出惊人的能力。
VR远程操控与AI自主决策的结合,代表了人机协作的新方向。操控者可以通过VR设备身临其境地感受机器人的视角,而AI则负责处理复杂的运动控制。
科技伦理与未来展望
虽然目前的机器人格斗更多是一种娱乐形式,但它也引发了关于AI和机器人技术应用的讨论。随着人形机器人技术的不断进步,类似的竞技活动可能会变得更加普遍。
科技作家Ashlee Vance对这一话题的关注,也反映了科技界对AI和机器人技术发展趋势的持续关注。
(本文综合X@ashleevance、X@jeffs2009等媒体报道)
via AI新闻资讯 (author: AI Base)
IBM 近日正式推出了 Granite4.01B Speech。这是一款专为边缘计算和企业级部署设计的紧凑型语音语言模型,旨在提供高效率的多语种自动语音识别(ASR)与双向自动语音翻译(AST)能力。
与前代版本相比,Granite4.01B Speech 的参数量仅为上一代模型的一半,但在性能上实现了显著跃升。新模型不仅增加了对日语 ASR 的支持,还引入了关键词偏置功能,并大幅提升了英文转录的准确率。其核心设计目标是在不牺牲核心能力的前提下,极大地降低内存占用、推理延迟和计算成本。
该模型采用了创新的“两阶段设计”架构。系统首先将音频转换为文本,随后通过专门的 Granite 语言模型进行推理处理。这种模块化设计允许开发者根据需求灵活编排流程。目前,该模型已支持包括英语、法语、德语、西班牙语、葡萄牙语和日语在内的多语种互译,并能处理英语对中文(普通话)的翻译任务。
在性能测试中,Granite4.01B Speech 表现出色,位居 OpenASR 排行榜首位,平均字错率(WER)仅为5.52。目前,IBM 已根据 Apache2.0协议正式开源该模型,开发者可通过 Transformers 或 vLLM 等主流框架进行本地部署,为资源受限的移动端或边缘设备提供强劲的 AI 语音支持。
项目:https://huggingface.co/ibm-granite/granite-4.0-1b-speech
via AI新闻资讯 (author: AI Base)
传统的 AI 配音在面对影视、动画等高标准场景时,常因难以匹配复杂的情绪爆发和精准口型而遭遇瓶颈。针对这一痛点,通义实验室正式发布并开源了首个影视级多场景配音多模态大模型——Fun-CineForge。
突破“声画脱节”:四大严苛维度的协同
不同于仅依赖文字转语音的传统模型,Fun-CineForge 旨在攻克影视制作中的四大核心挑战:
● 口型同步: 实现合成语音与画面唇部运动的高度一致。
● 情绪表达: 结合面部形象与指令描述,赋予声音拟人化的情感深度。
● 音色一致性: 在复杂的多角色对话中保持特定人物的音色稳定。
● 时间对齐: 即使说话人被遮挡或不在画内,语音也能在毫秒级精确的时间点切入。
核心技术:引入“时间模态”与高质量数据集
Fun-CineForge 的技术突破在于其独有的 “数据+模型”一体化设计:
1. CineDub 高质量数据集: 通义实验室配套开源了 CineDub 自动化数据集构建流程。该流程利用思维链纠错机制,将中英文文本转录错率降至 1% -2% 左右,说话人分离错误率大幅降至 1.2%。
2. 四模态融合架构: 模型首次引入 “时间模态”,配合视觉(唇形表情)、文本(台词情感)和音频(音色参考)共同建模。这使得模型即便在“看不到”人脸的复杂场景下,也能依靠时间监督目标实现精准同步。
表现卓越:填补多人对话配音空白
实验数据显示,Fun-CineForge 在词错率(WER/CER)、唇部同步度(LSE-C/D)及音色相似度上均显著优于 DeepDubber-V1等基线模型。尤其值得关注的是,该模型首次实现了对双人及多人对话场景的精准支持,在30秒以内的视频片段中表现出极强的鲁棒性。
● GitHub:https://github.com/FunAudioLLM/FunCineForge
● HuggingFace:https://huggingface.co/FunAudioLLM/Fun-CineForge
● ModelScope:https://www.modelscope.cn/models/FunAudioLLM/Fun-CineForge/
via AI新闻资讯 (author: AI Base)
今日,有赞发布官方声明,澄清其投资企业与央视3·15晚会曝光的“AI投毒”事件无涉,并明确划定AI营销业务的安全合规边界。
针对媒体将晚会点名的GEO相关产品与有赞投资的“南京小裂变网络科技有限公司”进行关联报道,有赞回应称,2021年对小裂变的投资仅限于企业微信生态工具开发,双方在GEO业务上不存在任何股权、业务或技术关联。经核实,涉嫌通过自动化手段篡改大模型生成结果的“力擎GEO优化系统”并非小裂变开发或运营。
此次事件揭示了“GEO(生成式引擎优化)”概念在非法产业链中的异化。据此前报道,涉事公司通过虚构产品信息并利用GEO系统大量发布软文,诱导AI大模型在回答“智能健康手环推荐”等咨询时给出虚假排名,形成了新型的“AI投毒”乱象。
有赞对此表示,其旗下AI业务“加我推荐官”定位为优化品牌表达而非虚假包装,严厉反对“投毒式”营销。目前,该业务已与主流模型厂商达成合规沟通。随着大模型商业化渗透加深,如何区分合规的生成式内容优化与恶意的信息污染,正成为AI营销领域亟待确立的行业标准,监管侧对AI内容真实性的穿透式管理也将进一步提速。
via AI新闻资讯 (author: AI Base)
AI 守护“巨兽”:印度利用智能预警系统减少大象铁路事故
印度环境、森林与气候变化部近期举办了专题研讨会,探讨利用人工智能技术保护大象及铁路工人的安全。其中最引人注目的方案是在泰米尔纳德邦部署的 AI 预警系统,该系统利用搭载热成像与运动感应技术的摄像头网络,能在 100 米范围内识别大象踪迹并自动提醒相关部门,确保列车及时减速。
此外,印度多个大象迁徙走廊已安装基于分布式声学传感(DAS)的侵入检测系统。除技术手段外,印度政府也强调了建设桥梁、下穿通道等物理屏障的必要性,以全方位减少铁路沿线的大象伤亡。
via AI新闻资讯 (author: AI Base)
印度环境、森林与气候变化部近期举办了专题研讨会,探讨利用人工智能技术保护大象及铁路工人的安全。其中最引人注目的方案是在泰米尔纳德邦部署的 AI 预警系统,该系统利用搭载热成像与运动感应技术的摄像头网络,能在 100 米范围内识别大象踪迹并自动提醒相关部门,确保列车及时减速。
此外,印度多个大象迁徙走廊已安装基于分布式声学传感(DAS)的侵入检测系统。除技术手段外,印度政府也强调了建设桥梁、下穿通道等物理屏障的必要性,以全方位减少铁路沿线的大象伤亡。
via AI新闻资讯 (author: AI Base)
蚂蚁灵波与乐聚达成战略合作,推进“一脑多机”应用落地
3月16日,上海蚂蚁灵波科技有限公司(以下简称“蚂蚁灵波”)与乐聚智能(深圳)股份有限公司(以下简称“乐聚机器人”)正式签署战略合作协议。双方将充分发挥各自在具身智能大模型与机器人本体技术领域的优势,围绕工业、商业场景展开深度协同,形成“本体+数据+模型”协同创新示范,加速推动具身智能机器人迈向通用智能。
据了解,此前乐聚机器人作为核心数据合作伙伴,为蚂蚁灵波LingBot-VLA具身大模型提供近万小时高质量多模态真机数据,跑通“硬件场景-数据-算法”闭环,并助力LingBot-VLA智能基座实现跨本体、跨任务泛化能力突破,推动“一脑多机”走向工程化落地。
接下来,双方将依托蚂蚁灵波在具身大模型方面的技术能力与乐聚在本体、数据、场景方面的深厚积累,构建高价值具身智能真机数据集,开展模型训练、优化迭代与本体适配,持续提升机器人“感知、理解、决策、执行、学习”全链路能力。面向工业、商服等典型应用场景,双方还将共同沉淀可复制的行业解决方案与标杆案例,加速具身智能应用规模化落地。
当前,具身智能产业正处在从技术验证迈向场景落地的关键阶段,如何推动模型能力、机器人本体与真实场景的深度融合,正成为行业持续探索的重要方向。此次合作将进一步推动相关技术在实际场景中的验证与应用,为产业发展提供有益参考。
via AI新闻资讯 (author: AI Base)
3月16日,上海蚂蚁灵波科技有限公司(以下简称“蚂蚁灵波”)与乐聚智能(深圳)股份有限公司(以下简称“乐聚机器人”)正式签署战略合作协议。双方将充分发挥各自在具身智能大模型与机器人本体技术领域的优势,围绕工业、商业场景展开深度协同,形成“本体+数据+模型”协同创新示范,加速推动具身智能机器人迈向通用智能。
据了解,此前乐聚机器人作为核心数据合作伙伴,为蚂蚁灵波LingBot-VLA具身大模型提供近万小时高质量多模态真机数据,跑通“硬件场景-数据-算法”闭环,并助力LingBot-VLA智能基座实现跨本体、跨任务泛化能力突破,推动“一脑多机”走向工程化落地。
接下来,双方将依托蚂蚁灵波在具身大模型方面的技术能力与乐聚在本体、数据、场景方面的深厚积累,构建高价值具身智能真机数据集,开展模型训练、优化迭代与本体适配,持续提升机器人“感知、理解、决策、执行、学习”全链路能力。面向工业、商服等典型应用场景,双方还将共同沉淀可复制的行业解决方案与标杆案例,加速具身智能应用规模化落地。
当前,具身智能产业正处在从技术验证迈向场景落地的关键阶段,如何推动模型能力、机器人本体与真实场景的深度融合,正成为行业持续探索的重要方向。此次合作将进一步推动相关技术在实际场景中的验证与应用,为产业发展提供有益参考。
via AI新闻资讯 (author: AI Base)
AI记忆技术领域近日爆发重磅融资消息。HydraDB成功获得650万美元投资,该项目直言要“干掉”传统向量数据库,全面升级AI的长期记忆能力。相比当前主流方案,HydraDB采用全新架构,有望彻底解决“相似不等于相关”的行业痛点。
向量数据库的致命缺陷:相似≠相关
当前AI主流记忆方案是将对话内容切碎后塞进向量数据库,依靠“找相似”来实现回忆。这种方法看似高效,却在实际应用中频频翻车。
真实案例显示:当AI被要求查询一份合同文件时,它返回了一份格式完美无缺的文件——但这份文件实际上属于另一个完全不同的客户。相似度检索虽然找到了“格式接近”的内容,却完全忽略了核心关联性,导致AI输出严重失准。
HydraDB颠覆式新思路:关系图谱+Git式追加
HydraDB彻底抛弃碎片化存储,转而构建智能关系图谱,让AI记忆更接近人类逻辑。核心创新包括三大突破:
不存碎片,只存关系
系统不再把信息拆成孤立碎片,而是记录实体间的关联关系。它能准确识别“你在A公司工作”和“你住在纽约”属于同一个人的同一件事,而不是两条毫不相关的记录。
信息变更不覆盖,像Git一样追加
当用户数据发生变化时,HydraDB不会简单覆盖旧记录,而是像Git版本控制系统一样进行追加。用户搬家后,旧地址依然完整保留,同时系统还记得“为什么搬家”的上下文,避免历史信息永久丢失。
每条记忆自带智能上下文
每一条记忆都自动关联丰富上下文。例如,用户说“我讨厌那个框架”,系统会智能补全为“用户讨厌React”,让AI后续对话始终保持精准理解,无需人工干预。
AI记忆革命即将到来
业内人士认为,HydraDB的这一创新直接击中了向量数据库的结构性短板,有望为AI助手、个人知识库、企业RAG系统带来质的飞跃。AIbase将持续关注HydraDB后续产品落地与技术迭代,敬请期待更多突破性进展。
论文地址:https://research.hydradb.com/cortex.pdf
via AI新闻资讯 (author: AI Base)
Google 宣布逐步向全港用户扩展 Gemini,后续覆盖 Mobile App
Google 宣布将逐步把 Gemini 网页应用扩展至全港所有用户,并将于稍后涵盖 Gemini 移动端。此前一般香港用户使用 Gemini 需连接 VPN,企业用户则不受此限。香港互动市务商会会长方保侨表示,日后一般用户无须连接 VPN 即可使用,并估计 Google 未来几日会逐步开放。
Yahoo 新闻 3 月 16 日中午约 12 时半实测显示,一般用户仍未能正常使用,页面出现「发生错误(13)」或提示「你所在的国家/地区目前不支援 Gemini」。
Yahoo 新聞 | 星島頭條網
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
Google 宣布将逐步把 Gemini 网页应用扩展至全港所有用户,并将于稍后涵盖 Gemini 移动端。此前一般香港用户使用 Gemini 需连接 VPN,企业用户则不受此限。香港互动市务商会会长方保侨表示,日后一般用户无须连接 VPN 即可使用,并估计 Google 未来几日会逐步开放。
Yahoo 新闻 3 月 16 日中午约 12 时半实测显示,一般用户仍未能正常使用,页面出现「发生错误(13)」或提示「你所在的国家/地区目前不支援 Gemini」。
Yahoo 新聞 | 星島頭條網
🍀在花频道 🍵茶馆聊天 📮投稿
via 科技圈🎗在花频道📮 - Telegram Channel
苹果公司计划在2026年全球开发者大会(WWDC)上正式发布代号为“Campo”的全新Siri,标志着其智能生态核心助手的深度重构。此前市场曾预期相关更新会出现在iOS26.4测试版中,但目前该进度已明确指向6月的软件发布周期,届时升级将全面覆盖iOS、iPadOS及macOS Tahoe系统。
此次功能升级的核心在于对话能力的质变,旨在使Siri的交互体验向ChatGPT或Claude等主流聊天机器人靠拢。为此,苹果与谷歌达成战略协议,将谷歌Gemini模型整合进“苹果基础模型”(Apple Foundation Models)底层架构。据悉,这项技术演进预计每年将耗费苹果约10亿美元的研发及运营成本。
在交互视觉层面,苹果将同步推出经过优化的“Liquid Glass”控制功能。针对iOS26中该设计系统的局限性,新版本将引入系统级滑块,赋予用户自主调节玻璃质感强度的权限。尽管由于工程挑战,该效果尚无法在全局应用中实现,但将率先深化在应用文件夹、导航栏及主屏幕的精细化控制。
此次动作反映出苹果在生成式AI领域的战略转向,即通过外部成熟模型与自研系统设计的深度耦合,弥补其在对话式AI领域的短板。随着WWDC2026的临近,Siri从传统语音工具向通用AI助理的转型,不仅是苹果对iOS27系列软件质量的全面提升,更预示着端侧AI交互将进入高定制化与强逻辑处理的新阶段。
via AI新闻资讯 (author: AI Base)
逆天改道!中国AI大模型周调用量连超美国,神秘“独角兽”Hunter Alpha暴力刷榜
在 AI 算力博弈的下半场,中国大模型正凭借惊人的应用渗透率实现“超车”。根据OpenRouter发布的最新数据,上周(3月9日至3月15日)中国 AI 大模型的周调用量再次刷新纪录,连续两周在国际主流平台上超越美国模型,展现出极强的爆发力。
数据显示,中国 AI 大模型的周调用量已飙升至 4.69万亿 Token,环比增长11.83%;相比之下,美国大模型周调用量则环比下滑9.33%,降至3.294万亿 Token。在全球调用量排行榜的前三名中,中国大模型更是实现了“清场式”霸榜:
MiniMax M2.5:连续五周稳坐冠军宝座,周调用量高达1.75万亿 Token。
阶跃星辰 Step3.5Flash:凭借极速响应和免费策略,首次杀入前三便摘得榜眼,周调用量环比狂增79%。
DeepSeek V3.2:以1.04万亿 Token 的成绩稳居第三。
在这场算力狂欢中,最令人侧目的是一个名为 Hunter Alpha 的“神秘新面孔”。该模型于3月11日刚上线,便以0.666万亿 Token 的战绩暴力冲进全球第七。
据OpenRouter平台资料显示,Hunter Alpha是一款专为智能体(Agent)应用构建的万亿参数模型,拥有100万 Token 的超长上下文能力。它在长期规划、复杂逻辑推理以及多步骤任务执行上表现惊人,尤其在对接OpenClaw等框架时,展现出了极高的可靠性和指令执行精度。
从 MiniMax 的持续霸榜到阶跃星辰的异军突起,再到神秘模型Hunter Alpha的惊艳亮相,中国大模型正通过高频的迭代和精准的场景切入,重塑全球 AI 应用的权力版图。当 Token 调用量成为衡量 AI 繁荣度的新标尺,这场“算力东移”的趋势已愈发不可阻挡。
via AI新闻资讯 (author: AI Base)
在 AI 算力博弈的下半场,中国大模型正凭借惊人的应用渗透率实现“超车”。根据OpenRouter发布的最新数据,上周(3月9日至3月15日)中国 AI 大模型的周调用量再次刷新纪录,连续两周在国际主流平台上超越美国模型,展现出极强的爆发力。
数据显示,中国 AI 大模型的周调用量已飙升至 4.69万亿 Token,环比增长11.83%;相比之下,美国大模型周调用量则环比下滑9.33%,降至3.294万亿 Token。在全球调用量排行榜的前三名中,中国大模型更是实现了“清场式”霸榜:
MiniMax M2.5:连续五周稳坐冠军宝座,周调用量高达1.75万亿 Token。
阶跃星辰 Step3.5Flash:凭借极速响应和免费策略,首次杀入前三便摘得榜眼,周调用量环比狂增79%。
DeepSeek V3.2:以1.04万亿 Token 的成绩稳居第三。
在这场算力狂欢中,最令人侧目的是一个名为 Hunter Alpha 的“神秘新面孔”。该模型于3月11日刚上线,便以0.666万亿 Token 的战绩暴力冲进全球第七。
据OpenRouter平台资料显示,Hunter Alpha是一款专为智能体(Agent)应用构建的万亿参数模型,拥有100万 Token 的超长上下文能力。它在长期规划、复杂逻辑推理以及多步骤任务执行上表现惊人,尤其在对接OpenClaw等框架时,展现出了极高的可靠性和指令执行精度。
从 MiniMax 的持续霸榜到阶跃星辰的异军突起,再到神秘模型Hunter Alpha的惊艳亮相,中国大模型正通过高频的迭代和精准的场景切入,重塑全球 AI 应用的权力版图。当 Token 调用量成为衡量 AI 繁荣度的新标尺,这场“算力东移”的趋势已愈发不可阻挡。
via AI新闻资讯 (author: AI Base)
谷歌将逐步扩展Gemini至全港所有用户
谷歌公司表示将逐步扩展Gemini网络应用程序至香港用户。人工智能聊天机器人Gemini是谷歌开发,结合文字、图像、语音和数据处理能力的大型语言模型,香港个人帐户一直未能直接登入。谷歌宣布,Gemini网络应用程式将逐步扩展至全港用户,稍后亦将涵盖移动应用程序,通过Gemini可协助处理日常各项事务,处理以及生成图像、音乐等多媒体内容。谷歌没有透露今次开放的人工智能模型是否涵盖最新的版本。
—— 有线新闻
via 风向旗参考快讯 - Telegram Channel
谷歌公司表示将逐步扩展Gemini网络应用程序至香港用户。人工智能聊天机器人Gemini是谷歌开发,结合文字、图像、语音和数据处理能力的大型语言模型,香港个人帐户一直未能直接登入。谷歌宣布,Gemini网络应用程式将逐步扩展至全港用户,稍后亦将涵盖移动应用程序,通过Gemini可协助处理日常各项事务,处理以及生成图像、音乐等多媒体内容。谷歌没有透露今次开放的人工智能模型是否涵盖最新的版本。
—— 有线新闻
via 风向旗参考快讯 - Telegram Channel
清华开源OpenMAIC:AI多智能体互动课堂,AI老师和AI同学陪你上课
【AIbase】X博主@AIGCLINK 发布推文介绍,清华大学最新开源项目OpenMAIC引发关注。这是一个AI多智能体互动课堂平台,给定任何主题或文档,AI就能自动生成完整的互动课程。该推文已获得超1.1万次浏览,119个点赞。
OpenMAIC:AI原生的虚拟课堂
据推文介绍,OpenMAIC最有趣的特点是里面有AI老师和AI同学,类似真实的虚拟教室。不止有AI老师讲课,还有AI同学陪学,让学习体验更加沉浸和互动。
平台集成了OpenClaw,可以直接在飞书、Slack、Telegram等常用协作工具里生成课堂,大大降低了使用门槛。
一键生成完整课程内容
给定主题后,OpenMAIC可以一键生成课堂内容,包括:
• 幻灯片讲义
• 测验题目
• HTML交互式模拟
• 项目制学习(PBL)
AI老师和AI同学的强大功能
课堂中的AI老师和AI同学具备多种互动能力:
• 语音讲解:支持语音形式的课程讲解
• 白板互动:可以在白板上画图、写公式
• 主动讨论:主动发起讨论或点名让学生发言
• 圆桌辩论:支持多人圆桌辩论模式
教育基础设施的升级
OpenMAIC相当于一个AI原生的教育基础设施,标志着从慕课看视频时代升级到了和AI一起上课的虚拟课堂时代。
这种新型的教育模式不仅提供了更加个性化的学习体验,也为教育行业带来了全新的可能性。学生不再只是被动观看视频,而是可以与AI老师和同学进行实时互动,获得更接近真实课堂的学习体验。
开源与可扩展性
作为开源项目,OpenMAIC为教育技术开发者提供了丰富的扩展可能性。开发者可以基于OpenMAIC构建更加定制化的教育应用,或者将其集成到现有的教育平台中。
结语
清华OpenMAIC的发布,展示了AI技术在教育领域的巨大潜力。随着多智能体技术的不断发展,未来的教育形态可能会发生根本性变革,AI将成为每个人学习路上的智能伙伴。
(本文内容整理自X@AIGCLINK)
via AI新闻资讯 (author: AI Base)
【AIbase】X博主@AIGCLINK 发布推文介绍,清华大学最新开源项目OpenMAIC引发关注。这是一个AI多智能体互动课堂平台,给定任何主题或文档,AI就能自动生成完整的互动课程。该推文已获得超1.1万次浏览,119个点赞。
OpenMAIC:AI原生的虚拟课堂
据推文介绍,OpenMAIC最有趣的特点是里面有AI老师和AI同学,类似真实的虚拟教室。不止有AI老师讲课,还有AI同学陪学,让学习体验更加沉浸和互动。
平台集成了OpenClaw,可以直接在飞书、Slack、Telegram等常用协作工具里生成课堂,大大降低了使用门槛。
一键生成完整课程内容
给定主题后,OpenMAIC可以一键生成课堂内容,包括:
• 幻灯片讲义
• 测验题目
• HTML交互式模拟
• 项目制学习(PBL)
AI老师和AI同学的强大功能
课堂中的AI老师和AI同学具备多种互动能力:
• 语音讲解:支持语音形式的课程讲解
• 白板互动:可以在白板上画图、写公式
• 主动讨论:主动发起讨论或点名让学生发言
• 圆桌辩论:支持多人圆桌辩论模式
教育基础设施的升级
OpenMAIC相当于一个AI原生的教育基础设施,标志着从慕课看视频时代升级到了和AI一起上课的虚拟课堂时代。
这种新型的教育模式不仅提供了更加个性化的学习体验,也为教育行业带来了全新的可能性。学生不再只是被动观看视频,而是可以与AI老师和同学进行实时互动,获得更接近真实课堂的学习体验。
开源与可扩展性
作为开源项目,OpenMAIC为教育技术开发者提供了丰富的扩展可能性。开发者可以基于OpenMAIC构建更加定制化的教育应用,或者将其集成到现有的教育平台中。
结语
清华OpenMAIC的发布,展示了AI技术在教育领域的巨大潜力。随着多智能体技术的不断发展,未来的教育形态可能会发生根本性变革,AI将成为每个人学习路上的智能伙伴。
(本文内容整理自X@AIGCLINK)
via AI新闻资讯 (author: AI Base)