-
腾讯发布并开源混元3D世界模型2.0,一句话造出3D世界,兼容游戏引擎
最后更新: 2026-04-20 17:17:56
(文/陈济深 编辑/张广凯)
4月16日,腾讯正式发布并开源混元3D世界模型2.0( HY-World 2.0)。HY-World 2.0是一个多模态世界模型,能够理解文字、图片、视频等不同类型输入,自动生成、重建和模拟 3D 世界,同时支持多格式3D资产(Mesh/3DGS/点云等)导出,可以与现有的游戏工作流无缝对接,用于快速生成游戏地图和关卡原型。
混元世界模型 2.0让 AI 从“对话”、“画图”、“捏物体”,进化到了“造世界”——包含人、物、景的完整世界。不同于谷歌的Genie 3和混元世界模型1.5仅能生成一分钟视频文件,世界模型2.0的实用性更进一步:它可以直接生成可二次编辑的3D资产文件,这些生成的3D资产可以直接导入到游戏制作或者具身仿真引擎,实现真正可玩、可用。
目前,世界模型2.0已经上线至腾讯混元3D创作引擎官网,用户可以申请使用。(申请使用地址:https://3d.hunyuan.tencent.com/sceneTo3D)
实机演示:输入“生成一个日式RPG风格的中世纪地牢”,即可生成一个3D空间资产
实机演示:输入“生成一个温馨的绘本风格小木屋”,游戏角色可以自由穿行在生成的3D场景中所有内容均为3D文件,且全部由HY-World 2.0大模型一键生成
支持多种模态输入,草图变地图、图片变空间
混元世界模型2.0支持文、图、视频多种输入。输入一段文字或一张图片,模型即可精准解析复杂语义,一键生成风格多样的可漫游世界。相比较混元世界模型1.0,2.0的模型架构全面升级,画面精细度和真实感大幅提升。用户还可以自定义风格,按需生成真实风、漫画风、游戏风的3D空间。生成完成后,用户可以将资产导入到Unity、UE 等引擎、进行二次编辑,显著降低了游戏地图的创作门槛。
模型还支持角色模式,用户可以操作角色在街道、建筑、场景中自由探索,不限时间,具有物理碰撞,就像在游戏里一样。
同时,世界模型2.0支持复刻真实3D场景,用户输入一段真实空间的视频或者多视角图片,模型就能构建出高精度的数字孪生空间。基于升级后的 WorldMirror 2.0 架构,模型支持任意尺寸图像与视频输入,一次性预测密集点云、多视角深度图、表面法线及相机参数 ,一次生成永久可复用。未来,室内装修预览、城市规划、文化遗产保护等场景,都可以基于这一能力实现快速构建和还原。
与其他世界模型相比,混元世界模型2.0在场景完整度(物体侧面和背面)以及对输入图片的遵循程度表现更优。混元生成的3DGS与Mesh的混合表征,也让用户能够开启角色模式进行有真实物体碰撞的交互。
以3D生成为主轴,统一空间理解、生成、重建
混元世界模型2.0以3D为主轴,通过统一空间理解、生成、重建的架构,实现了SOTA级的生成效果。
传统方法需要精确的相机参数才能生成全景图,但现实中这些参数往往拿不到。
HY-World 2.0 全新升级HY-Pano-2.0模型, 采用端到端隐式学习方案,让模型自己学会从普通图片到 360 度全景的空间映射,完全不需要任何相机元数。再配合团队的真实全景照片和 UE 引擎合成数据的混合训练策略,保证了生成质量和泛化能力。
有了全景图,下一步是规划“怎么走”。
通过团队自研的空间Agent技术,结合VLM与游戏自动寻路算法常用的navmesh表征,让大模型能够理解空间语义,并智能规划出有意义的漫游轨迹,确保覆盖场景中最有价值的区域,同时避免穿墙、跑飞。模型会根据每个场景的不同语义,规划出“环绕物体”、“最大漫游”等五类运镜轨迹,这样搭配下一步的世界扩展模型,可以让用户在 3D 世界中的探索路径既自然又有趣。
沿着规划好的轨迹,模型通过视频生成技术不断“扩展”世界。
这一步的关键创新在于“精确的相机控制 + 细粒度视觉细节保持 + 空间一致性记忆机制”,这一套流程可以确保新生成的区域与已有区域在几何和视觉上完美衔接,不会“穿帮”。通过记忆力机制的设计以及体系化的中间训练和后训练,团队打造了目前业界最强的新视角生成(NVS)模型HY-WorldStereo。生成画面对输入相机的精准跟随,且多条运镜的生成结果保持空间一致不会有冲突;通过后训练算法的设计,使得保持快速生成的同时画面质量不会衰减。
最后,将所有生成的片段通过HY-WorldMirror 2.0 整合为一个统一的、可交互的 3D 世界。使用定制的Depth alignment和自适应Mask gaussian场景优化算法,生成的场景采用 3D 高斯泼溅(3DGS)表示,同时可以转出高质量mesh,可以无缝导出到 Unity/UE 等主流游戏引擎,支持二次编辑和创作。
混元世界模型(HY-World 系列)自发布以来就在持续进化:从首个开源的3D世界模型 HY-World 1.0 ,到可实时在线交互的 HY-World 1.5 ,再到一键生成高质量完整3D空间资产的 HY-World 2.0,腾讯混元的3D世界模型正在一步步将“AI 造世界”从概念变为现实。
申请在线体验:https://3d.hunyuan.tencent.com/sceneTo3D
开源代码:https://github.com/Tencent-Hunyuan/HY-World-2.0
技术报告: https://3d-models.hunyuan.tencent.com/world/world2_0/HY_World_2_0.pdf
本文系观察者网独家稿件,未经授权,不得转载。
- 责任编辑: 陈济深 
-
灵光上线“灵光圈”, 打造人人可用的Coding Agent
2026-04-20 17:17 观网财经-互联网 -
阿里发布世界模型HappyOyster,与谷歌Genie3竞争
2026-04-20 17:16 观网财经-互联网 -
爱奇艺发布纳逗Pro平台、新爱奇艺号和分账新规,助力AIGC影视创作者起步
2026-04-20 16:08 观网财经-互联网 -
投资之禾,开云到底还是放不下中国
2026-04-20 15:12 观网财经-消费 -
中国移动集采6万台服务器,ARM处理器占比升至65%
2026-04-20 12:51 观网财经-科创 -
小米徐洁云回应“雷军被堵车里”:造谣的等着
2026-04-20 12:20 观网财经-科创 -
从蓝帽子溯源到合规破局,东方甄选6款自营保健食品获国家认证
2026-04-20 09:35 -
长江存储加速扩产,单季收入被曝超200亿元
2026-04-20 06:34 观网财经-科创 -
亦庄半马深度观察:50分26秒,一场炸裂的“无用之用”
2026-04-19 16:57 观网财经-科创 -
速卖通Brand+背后的中国怪物房出海逻辑
2026-04-19 16:09 产经 出海 -
中国机器人租出海,一天6000美元?
2026-04-19 14:45 产经 科创 -
高德首款具身机器人亮相马拉松大赛
2026-04-19 14:15 观网财经-互联网 -
DeepSeek终于要融资了,估值100亿美元合理吗?
2026-04-18 12:02 观网财经-互联网 -
终结千年失语,盒马助“贵州抹茶”突围
2026-04-17 20:39 观茶咖 -
-
超声穿颅,全脑读写:人脑与AI连接的终极答案浮现?
2026-04-17 20:04 产经 人物·专题 -
茅台首次双降,但每日仍净赚2.3亿元
2026-04-17 17:53 -
外媒热评,WPS把iPad变成生产力工具了?
2026-04-17 17:17 观网财经-海外 -
降费增利,三七互娱的AI转型之路尚在途中
2026-04-17 17:17 观网游戏 -
存储牛股业绩猛涨,却遭实控人堂姐清仓式减持?
2026-04-17 17:08 产经 科创
相关推荐 -
54名美议员集体发难:韩国左翼政府偏袒中企 评论 57
“中方不满韩国涉台口惠而实不至,要求解释” 评论 21
火到爆!“我一提中国车,视频观看量就噌噌涨” 评论 106
“伊朗战争正撕裂美国阵营” 评论 76
创造4万亿帝国、访华20次,库克留下了什么 评论 49最新闻 Hot-
“阿联酋要求美国提供金融支持,不然就用人民币了”
-
“要想在全球卖得好,还得靠中国技术”
-
“情况非常糟糕,差了中国几百倍”
-
“德桑蒂斯想当大法官”
-
“特朗普想把帮过美军的阿富汗人,丢到非洲刚果”
-
54名美议员集体发难:韩国左翼政府偏袒中企
-
“中方在批评菲律宾不知感恩”
-
三国不准赖清德专机过领空,国台办点赞
-
美国想不到,来找中国造船的更多了
-
警惕!日本126名议员集体“拜鬼”,高市再献祭祀费
-
美军高官拿台湾说事:饿死鸡,蛋就没了
-
40年前,中国人连宣传册都抢,如今德企还“忽悠”得动吗?
-
荷兰高官演上了:我们好脆弱,中国与美国“不相上下”
-
伊朗处决米尔贾法里
-
“听到美国要查中国成分,现场一阵倒吸冷气”
-
樊振东晒与黄仁勋合影
-

观察员
上海市互联网违法与不良信息举报中心