AI 快讯交通运输部押注端到端大模型,自动驾驶进入AI原生时代
行业快讯

交通运输部押注端到端大模型,自动驾驶进入AI原生时代

2026-06-25T05:03:19.409Z
交通运输部押注端到端大模型,自动驾驶进入AI原生时代

交通运输部等五部门联合发文,明确将端到端大模型作为智能驾驶核心技术路线。这标志着自动驾驶从规则驱动转向数据驱动的范式革命,货运、园区等场景将率先突破。

交通运输部押注端到端大模型,自动驾驶进入AI原生时代

交通运输部等五部门今天联合印发《"人工智能+交通运输"典型应用场景创新行动方案》,首次在国家层面明确将"端到端大模型"作为智能驾驶核心技术路线。这不是简单的政策表态,而是对过去十年自动驾驶技术路线的一次系统性重构。

从规则链条到神经网络,一个模型替代整套系统

传统自动驾驶系统就像流水线车间:感知模块识别障碍物,决策模块判断行为,规划模块计算轨迹,控制模块执行动作。每个环节都有人工编写的规则,模块间通过标准化接口传递信息。这套架构清晰易懂,但问题在于——人写不完所有规则。

端到端把整条链路压缩成一个神经网络。摄像头、雷达的原始数据直接输入,模型输出方向盘转角、油门刹车深度。中间没有"先识别车辆再判断距离"的分步骤,而是像人类司机一样,看到画面就知道该怎么开。

这不是技术细节的优化,而是解决问题方式的根本改变。特斯拉FSD V12在北美路测时,遇到施工区域的交警手势指挥,传统系统会因为没见过这种"非标场景"而卡死,但端到端模型直接从训练数据里学会了"看懂手势"。行业普遍认为,这是接近L4级自动驾驶的关键一步。

端到端架构与传统模块化架构对比示意图

政策瞄准的不是乘用车,而是商用场景的降本增效

方案明确提出三个落地方向:公路货运、园区运输、短途接驳。这些场景有个共同特点——路线相对固定,法规环境可控,经济账算得过来。

矿区是最典型的试验田。内蒙古、山西的露天矿山,无人驾驶矿卡已经跑了上百万公里。但早期系统依赖厘米级高精地图和激光雷达,一辆车的智驾硬件成本超过50万。端到端方案用纯视觉+毫米波雷达就能实现,硬件成本压到10万以内,关键是算法迭代不再需要重新标注地图。

港口集装箱运输也在快速推进。上海洋山港的智能重卡,现在用的还是基于规则的V2X协同系统,需要路侧设备配合。如果换成端到端,车辆可以像人类司机一样"看着开",基础设施改造成本至少省掉60%。

方案里还有个细节:要求建立"虚实结合的智能化测试场"。这对应的是端到端训练的核心难题——数据闭环。模型需要海量Corner Case(边缘案例)来学习,但真实道路采集效率太低。仿真平台可以批量生成"雨夜+行人突然窜出+前车急刹"这类极端组合,让模型在上路前就见过足够多的"世面"。

公路、铁路都在用大模型重构感知系统

方案对智慧公路的描述值得细看:"利用多模态大模型等技术,提升覆盖基础设施、交通运行、路网环境的公路全要素感知能力"。翻译过来就是:路侧摄像头不再只是录像,而是要实时理解路况。

现在高速公路的监控视频,90%都是存下来等事后调查用的。AI介入后,系统可以自动识别"施工区域的锥桶歪了""应急车道有抛洒物""右侧车道三辆大货车并排压低速"。这些信息实时推送给自动驾驶车辆,相当于给每辆车配了个"全局视角外挂"。

铁路领域提出的"智能列车与运行控制系统",本质上也是端到端思路。传统列控系统通过地面应答器告诉列车"前方3公里是红灯",车载ATP(列车自动防护)系统按预设曲线刹车。新方案要让列车自己"看懂"信号机、识别轨道状态,甚至预判前车的减速意图。

华为在青藏铁路试点的全自动驾驶系统,已经在用视觉大模型做道岔识别和障碍物检测。之前靠人工巡检的钢轨裂纹、接触网磨损,现在车载摄像头扫一遍,AI就能标出来。

大模型上车的三道坎:算力、数据、安全

端到端听起来美好,但量产落地还有硬骨头要啃。

算力是第一关。特斯拉FSD V12的模型参数量超过千亿,推理需要几百TOPS的算力。英伟达Thor芯片能提供2000TOPS,但功耗200瓦,散热和成本都是问题。国内极越、小鹏用的地平线征程6芯片,算力只有560TOPS,要跑完整端到端模型还得做剪枝优化。

数据闭环更关键。百度Apollo累计路测超过3500万公里,但真正有价值的Corner Case可能不到0.1%。如何从海量视频里筛出"有代表性的极端场景",如何确保训练数据不带偏见(比如都是晴天数据导致雨天失灵),这些都需要专门的数据工程团队。

安全性是底线。端到端模型是个"黑盒",出了事故很难解释"为什么会这么决策"。理想汽车给出的方案是双系统架构:端到端模型负责常规驾驶,传统规则系统做安全兜底。小鹏则在模型上加了"安全类脑",用神经网络模拟人类的"趋利避害本能"。但这些方案都还在试验阶段,监管认不认还是未知数。

2026年是个分水岭

从时间表看,2025年是感知端到端上车元年,2026-2027年会出现真正的"One Model"系统。这个判断基于两个观察:

一是算力平台的成熟周期。英伟达Thor、高通Snapdragon Ride Flex今年下半年才量产,车企拿到芯片后需要至少一年时间做适配和测试。二是法规进度。联合国WP.29论坛计划2026年1月完成L4自动驾驶全球技术法规,国内的《智能网联汽车准入和上路通行试点》也在同步推进。

方案里还有个被忽视的信号:要求"开展交通流态势智能推演与拥堵机理分析,自动生成疏导策略"。这意味着端到端不只用在车上,还会用来优化整个路网的调度。想象一下:城市交通大脑实时分析所有路口的车流,用强化学习算出最优红绿灯时长,再通过V2X推送给自动驾驶车辆。车和路形成一个巨大的神经网络,这才是"车路云一体化"的终极形态。

技术路线之争结束了,但商业模式还没开始

国内玩家已经全员押注端到端。小鹏XNGP 5.0用XNet+XPlanner双大模型,蔚来拆分出专门的大模型部,理想搞"快思考+慢思考"双系统,华为ADS 3.0实现GOD感知+PDP决策一张网。大家的架构细节不一样,但方向高度一致。

真正的分歧在商业化路径。特斯拉卖FSD订阅,每月199美元;国内车企大多选择标配或选装包。但自动驾驶的成本结构变了:传统方案是硬件成本高、软件边际成本低,端到端是硬件成本降低、算力和数据成本暴涨。谁来为云端训练的GPU集群买单?如何定价才能覆盖持续的OTA迭代?这些问题比技术本身更难回答。

政策给的是方向,但没有给答案。方案提出"推进货物运输技术性降本提质增效",暗示端到端在商用场景要先把经济账算通。至于乘用车市场,可能要等到2027年之后,看谁能先跑出可持续的商业模式。

端到端大模型是自动驾驶的iPhone时刻,还是又一轮技术泡沫?两年后见分晓。但至少现在,行业不再争论"要不要做",而是在比拼"谁做得更快更好"。这本身就是巨大的进步。


参考来源

相关推荐

查看全部

联系我们

我们通常在工作时间快速响应

扫码添加微信

专属客服:Hub 助手

微信号: