商汤科技(00020)周二盘中股价大跌5.21%,引发市场关注。公司在2025年GDC开发者大会上发布了最新自动驾驶技术"R-UniAD",这项技术采用了强化学习算法,有望突破现有自动驾驶技术的性能瓶颈,实现超越人类水平的驾驶能力。
与模仿学习不同,强化学习算法可以让模型自主探索、尝试各种驾驶方式,并从中学习获得奖励从而优化策略。同时结合世界模型技术,在虚拟环境中进行交互式训练,有望大幅降低训练所需的数据量,提高训练效率。
业内分析认为,这项新技术颇具突破意义。未来基于强化学习的自动驾驶系统不仅可以达到人类水平,更有望超越传统驾驶员。市场对此科技进展寄予厚望,但短期内也可能令商汤的研发投入加大,影响短期业绩表现。