商汤绝影发布最新技术 有望让自动驾驶超越人类老司机?

南方都市报
24 Feb

  近日在上海举办的2025GDC全球开发者先锋大会上,众多科技前沿企业展示了最新成果,旨在探索大模型产业化解决方案,推进场景落地应用,实现商业模式的正向闭环。

  其中,商汤绝影重磅发布了行业首个“与世界模型协同交互的端到端自动驾驶路线R-UniAD”,通过构建世界模型生成在线交互的仿真环境,以此进行端到端模型的强化学习训练。

  “算法、算力和数据三者共同推动着人工智能技术的螺旋式上升和进步,随着强化学习等算法引入到大模型训练的思路得到验证,新的尺度定律正在开启,数据价值被进一步深入挖掘,模型能力天花板被打开。”在商汤大模型生产力论坛上,商汤绝影CEO,商汤科技联合创始人、首席科学家王晓刚这样表示。

  商汤绝影此次推出的R-UniAD,与春节开始持续受到市场关注的DeepSeek技术创新思路同归一源:从模仿学习向强化学习升级演进,从而实现端到端自动驾驶超越人类的驾驶表现。

  那么,模仿学习和强化学习的特征分别是什么?又有什么区别?

  如果以AI学下棋为例的话,模仿学习就是照着棋谱,一步步走,将整个下棋过程完整复刻一遍;而强化学习则是让AI在遵守规则的基础上自己尝试无数种下法,每赢一次就能获得奖励、升级策略,最后自己摸索出最佳下法。

  到了如今非常主流的端到端自动驾驶领域,模仿学习就是通过海量的高质量人类驾驶数据,来实现最佳的“模仿”驾驶效果。

  然而,基于模仿学习的技术范式,可以接近人类,却难以突破人类能力上限。同时,受限于高质量场景数据的稀缺性和驾驶数据质量的参差不齐,端到端智驾方案要达到人类驾驶能力的天花板并不容易,动辄千万Clips的高质量数据回流更是形成了规模门槛。

  这与人工智能如今面临的困境是非常相似的。随着互联网上的数据红利被“榨干”,大模型性能的提升只能依靠进一步扩大算力规模和增加模型参数,演变成算力上的肌肉比拼,这也就是业内不少人惊呼“尺度定律(Scaling laws)已经失效”的原因。

  这也是今年春节DeepSeek会引发轩然大波的原因。其R1基于少量高质量数据的冷启动,通过多阶段的强化学习训练,就能大大降低大模型训练的数据规模门槛,同时也让尺度定律得以延续,为模型变得更大更强铺平了道路。

  更重要的是,强化学习能够让大模型自行涌现出长思维链能力,显著提升推理效果,甚至可能具备超越人类的思维能力。

  王晓刚表示,基于强化学习的大模型技术路线,完全可以迁移到端到端自动驾驶算法的训练与研发之中。

  R-UniAD就是通过高质量数据进行冷启动,用模仿学习的方式训练出一个端到端基础模型,再通过强化学习方法进行训练的。

  根据测算,小样本多阶段学习的技术路线能让端到端自动驾驶的数据需求降低一个数量级,让车企合作伙伴有望换道超车特斯拉FSD。

  从性能上限来看,纯强化学习训练让端到端智驾模型有望通过在提升性能的同时,充分探索多元场景和驾驶风格。未来,端到端智驾体验的上限不再是“类人”,而是可以拥有超越人类的驾驶表现。

商汤绝影现场演示端到端算法与世界模型仿真环境实时交互

  要达到这个目的,智驾模型就必须在世界模型生成的仿真环境进行在线交互,并获得闭环奖励反馈,从而实现强化学习。为此,商汤绝影升级并发布了行业标杆级别的世界模型——“开悟”世界模型。

  基于“开悟”,1个GPU产生的仿真数据相当于500台量产车的数据采集效果,实车采集的真实数据和云端生成的仿真数据在“车云一体”的新范式下进行闭环流转,使得端到端智驾系统的训练更加全面、高效,大幅缩短了研发周期,降低了成本。

  在2024年北京车展上,商汤绝影曾展示UniAD的实车上路成果,而在今年4月即将到来的上海车展上,商汤绝影的R-UniAD端到端自动驾驶方案也将正式发布,并完成实车部署。

  根据商汤绝影的规划,此套方案能助力车企,在更小数量级的数据基础上,超越特斯拉依靠百万台量产车数据回流的自动驾驶方案。届时它能否超越人类的驾驶水平,加速智能汽车驶入AGI全新未来,南都·湾财社将持续关注。

(文章来源:南方都市报)

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10