腾讯开源混元3D 世界模型2.0,支持一键生成可编辑3D 空间资产
腾讯混元团队今日宣布正式发布并开源“混元3D 世界模型2.0”(HY-World2.0)。作为多模态世界模型的重大升级,该版本实现了从单纯生成视频向生成“可交互、可编辑3D 资产”的跨越。模型支持文、图、视频等多种模态输入,能够自动生成、重建并模拟包含人、物、景的完整3D 空间,并支持 Mesh、3DGS 及点云等多种格式导出,可与 Unity、UE 等主流游戏引擎工作流无缝对接。
技术架构上,HY-World2.0统一了空间理解、生成与重建流程。其核心升级包括:采用端到端隐式学习方案的 HY-Pano-2.0模型,可在无需相机参数的情况下实现360度全景映射;自研空间 Agent 技术结合 VLM 与 navmesh 表征,赋予模型智能规划漫游轨迹的能力;而 WorldStereo 机制则确保了新生成区域与既有场景在几何与视觉上的高度一致性。
此外,升级后的 WorldMirror2.0架构支持复刻真实场景,可一次性预测密集点云与相机参数,实现高精度的数字孪生构建。
相比谷歌 Genie3等主流模型,混元2.0的突破在于生成的资产具备真实物理碰撞属性,支持角色模式自由探索,显著降低了游戏关卡原型与具身智能仿真环境的构建门槛。
此次发布标志着腾讯混元在3D 生成领域从“捏物体”进化到“造世界”,通过 SOTA 级的空间一致性记忆机制,将 AI 驱动的3D 内容创作推向实用化阶段。
via AI新闻资讯 (author: AI Base)
腾讯混元团队今日宣布正式发布并开源“混元3D 世界模型2.0”(HY-World2.0)。作为多模态世界模型的重大升级,该版本实现了从单纯生成视频向生成“可交互、可编辑3D 资产”的跨越。模型支持文、图、视频等多种模态输入,能够自动生成、重建并模拟包含人、物、景的完整3D 空间,并支持 Mesh、3DGS 及点云等多种格式导出,可与 Unity、UE 等主流游戏引擎工作流无缝对接。
技术架构上,HY-World2.0统一了空间理解、生成与重建流程。其核心升级包括:采用端到端隐式学习方案的 HY-Pano-2.0模型,可在无需相机参数的情况下实现360度全景映射;自研空间 Agent 技术结合 VLM 与 navmesh 表征,赋予模型智能规划漫游轨迹的能力;而 WorldStereo 机制则确保了新生成区域与既有场景在几何与视觉上的高度一致性。
此外,升级后的 WorldMirror2.0架构支持复刻真实场景,可一次性预测密集点云与相机参数,实现高精度的数字孪生构建。
相比谷歌 Genie3等主流模型,混元2.0的突破在于生成的资产具备真实物理碰撞属性,支持角色模式自由探索,显著降低了游戏关卡原型与具身智能仿真环境的构建门槛。
此次发布标志着腾讯混元在3D 生成领域从“捏物体”进化到“造世界”,通过 SOTA 级的空间一致性记忆机制,将 AI 驱动的3D 内容创作推向实用化阶段。
via AI新闻资讯 (author: AI Base)