AI 快讯高德发布3D城市世界模型:一张卫星图10分钟重建城市
模型上新

高德发布3D城市世界模型:一张卫星图10分钟重建城市

2026-06-08T08:04:04.531Z
高德发布3D城市世界模型:一张卫星图10分钟重建城市

高德发布全球首个3D原生城市世界模型ABot-Earth0.5,单张卫星图像10分钟即可在消费级GPU上生成公里级3D城市场景,成本降至传统方式的1%,效率提升千倍,已覆盖190多个国家和地区。

高德发布3D城市世界模型:一张卫星图10分钟重建城市

今天(6月8日),阿里巴巴旗下高德正式发布ABot-Earth0.5——全球首个完全基于3D数据训练、工程可用的3D原生城市世界模型。这个模型最核心的能力是:给它一张卫星图或一段文字描述,10分钟内在一块消费级GPU上就能生成公里级的3D城市场景。

这不是演示Demo,是真能用的生产工具。输出格式是3DGS(3D Gaussian Splatting),可以直接导入Unity、Unreal Engine这些主流引擎做二次开发。按高德的测算,成本只有传统方式的1%,效率提升约1000倍。

ABot-Earth0.5生成的3D城市场景示例

传统3D建模是手工作坊,ABot-Earth是自动化工厂

传统3D地图制作流程你可能听过:航拍采集、点云处理、机器拼接、人工精修。每一步都需要专业设备和大量人力,完成1平方公里通常需要数小时到数天。这套流程的问题不只是慢和贵,更致命的是无法规模化——你要给全球190多个国家做高精度3D地图?按传统方式,这基本是不可能完成的任务。

ABot-Earth0.5的思路完全不同。它是完全基于3D数据训练的世界模型,输入是二维的卫星影像或文字描述,输出是三维的可编辑场景。这个过程不需要激光雷达、不需要倾斜摄影、不需要人工精修,AI直接理解卫星图里的建筑、道路、植被,然后生成对应的3D结构。

关键是速度和成本。10分钟、一块消费级GPU、公里级场景——这三个指标组合起来,意味着3D城市建模从"重资产专业工程"变成了"轻量化通用工具"。高德已经用这套系统建成了全球覆盖面积最广的3D地图,遍及190多个国家和地区。

3DGS格式:不只是看,还能直接用

ABot-Earth0.5输出的不是传统的点云或网格模型,而是3DGS格式。这个格式最近在图形学领域很火,核心优势是渲染速度快、质量高、文件体积小。更重要的是,它可以直接导入Unity、Unreal Engine等主流游戏引擎,开发者可以在生成的3D城市场景里做交互开发、路径规划、物理模拟。

这个特性对具身智能和机器人训练尤其关键。传统的机器人仿真训练需要先手工搭建虚拟环境,成本高、周期长,而且往往只能覆盖有限的场景类型。有了ABot-Earth0.5,你可以用真实城市的卫星图快速生成对应的3D训练场景,让机器人在虚拟环境里跑通算法,再迁移到真实世界。

高德之前发布的城市级仿真训练场,底层就是ABot-Earth0.5驱动的。这个训练场支撑了高德途途——全球首款开放环境全自主机器人——在城市环境中的仿真训练。具身智能这个赛道,训练数据的多样性和规模直接决定了模型的泛化能力,而ABot-Earth0.5把训练场景的构建时间从天级压缩到分钟级,填补了开放环境训练数据的空白。

应用场景:从低空经济到应急救援

高德列举了几个典型应用场景,每个都能解决实际痛点:

低空经济

无人机配送、eVTOL(电动垂直起降飞行器)这些低空经济的核心应用,都需要高精度的3D地形数据来规划航线、避障、着陆。传统测绘在复杂地形(山区、峡谷)和特种区域(边境、海岛)存在盲区,而ABot-Earth0.5凭借卫星影像就能快速生成对应区域的3D地形,让过去无图可用的区域有图可依。

这个能力对低空经济的商业化落地意义重大。无人机物流要大规模推广,首先得解决航线规划和安全问题,而3D地图是基础设施。ABot-Earth0.5把这个基础设施的建设成本和周期都降了一个数量级。

影视与游戏

开放世界游戏和影视特效制作中,城市场景的3D建模一直是最耗人力的环节之一。建模师需要手工制作建筑、道路、植被,调整细节,优化性能。ABot-Earth0.5直接输出可编辑的3DGS素材,让创作者可以把精力集中在创意本身,而不是重复性的建模工作。

对独立游戏开发者和小团队来说,这个工具的意义更大。以前做一个真实城市的开放世界游戏,光场景建模就可能需要几十人的团队干几个月,现在一个人10分钟就能生成基础场景,剩下的时间可以用来打磨玩法和叙事。

应急救援

这个场景可能是最有社会价值的。地震、洪水、火灾这些灾害发生后,救援指挥需要快速了解现场的三维环境:哪些道路被阻断、哪些建筑倒塌、哪些区域可以作为临时集结点。传统方式是派无人机现场勘查,回传影像后再人工分析,整个流程可能需要几小时。

ABot-Earth0.5的分钟级3D制图能力可以快速还原灾害现场的三维环境,为指挥调度提供科学依据。这几小时的时间差,在救援场景里可能意味着生命。

技术上的几个关键问题

精度如何保证?

从二维卫星图生成三维场景,最大的挑战是如何推断建筑的高度、形状、遮挡关系。高德没有详细披露技术细节,但从"完全基于3D数据训练"这个表述来看,ABot-Earth0.5应该是在大规模的3D城市数据集上训练的,学会了从二维到三维的映射关系。

这套方法的精度肯定不如激光雷达直接测量,但对大多数应用场景来说够用了。机器人仿真训练、游戏场景制作、低空航线规划,这些场景对精度的要求没有测绘那么苛刻,更看重覆盖范围和生成速度。

消费级GPU能跑多大场景?

"10分钟、消费级GPU、公里级场景"——这个指标组合很有意思。公里级场景意味着覆盖1-2平方公里的城市区域,包含数百栋建筑、道路网络、植被等元素。这个规模的3D场景,用传统建模方式可能需要几十GB的文件,渲染和编辑都需要工作站级别的硬件。

3DGS格式的优势在这里体现出来了:相比传统网格模型,文件体积小、渲染效率高。但"消费级GPU"这个说法比较模糊,是RTX 4060还是RTX 4090?10分钟是生成时间还是包含了优化和导出?这些细节高德没有公布,需要实际测试才能评估。

泛化能力如何?

高德声称已经覆盖190多个国家和地区,这意味着模型需要处理不同气候、不同建筑风格、不同城市密度的场景。欧洲的石砌老城、中东的沙漠城市、东南亚的密集棚户区、北美的郊区社区——这些场景的视觉特征差异巨大,模型能不能都处理好?

从目前的信息看,ABot-Earth0.5应该是在全球范围的卫星影像和3D数据上训练的,泛化能力应该不错。但具体到某些特殊场景(比如极地、热带雨林、沙漠),生成质量可能还需要实测验证。

对标的竞品和差异点

3D城市建模这个赛道并不冷门。Google Earth、Cesium、Mapbox都在做类似的事情,游戏引擎厂商Epic(Unreal Engine)和Unity也有城市场景生成工具,还有一些创业公司在做AI驱动的3D重建。

高德的差异点在于"3D原生"这个定位——完全基于3D数据训练,输入输出都是针对3D场景优化的。Google Earth的3D城市主要靠倾斜摄影和手工建模,精度高但成本也高;Cesium和Mapbox更偏向于地理信息可视化,渲染质量和交互性不如游戏引擎;游戏引擎的程序化生成工具(如Unreal的PCG)灵活但需要大量手工调参。

ABot-Earth0.5的定位是介于精确测绘和程序化生成之间:比测绘快得多、便宜得多,比程序化生成更真实、更符合实际地理。这个定位对具身智能、低空经济、内容创作这些新兴场景是刚需。

另一个值得注意的点是开放性。高德已经开放了内测申请(abot-earth.amap.com),这意味着它有可能做成平台级的服务,而不只是高德内部用的工具。如果定价合理、API易用,可能会成为机器人、游戏、影视行业的基础设施。

商业化和长期价值

高德没有公布ABot-Earth0.5的商业化模式,但从应用场景来看,有几个可能的方向:

  1. SaaS服务:按生成面积或调用次数收费,面向游戏开发者、机器人公司、低空经济企业
  2. 数据授权:把生成的3D场景数据授权给其他地图服务商或平台
  3. 定制化服务:为特定行业(如应急、国防)提供高精度的定制化3D建模
  4. 免费+增值:基础功能免费,高精度、高频调用、商业授权收费

从长期来看,ABot-Earth0.5的价值不只是工具本身,更是它定义的新范式:用AI把二维世界映射到三维空间,让3D内容生成从专业工程变成通用能力。这个范式如果跑通了,影响的不只是地图行业,还有整个空间计算生态——AR/VR、具身智能、自动驾驶、低空经济,这些赛道都需要高精度、大规模、低成本的3D世界表示。

高德在这个时间点推出ABot-Earth0.5,踩在了几个趋势的交汇点上:生成式AI的能力边界在快速扩展,具身智能和机器人开始从实验室走向应用,低空经济的政策和基础设施在加速完善。如果ABot-Earth0.5能在这些场景里跑通商业化,它可能不只是一个3D建模工具,而是空间智能时代的基础设施。

当然,现在下结论还早。模型刚发布,实际效果、稳定性、成本结构都需要更多实测数据。但至少从技术路线和应用定位来看,高德找到了一个值得深挖的方向。

目前ABot-Earth0.5已经开放内测,有兴趣的开发者可以去官网(abot-earth.amap.com)提交申请,实测一下这个"10分钟重建城市"到底靠不靠谱。


参考来源

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: