快科技3月10日消息,據媒體報道,理想汽車正在研發下一代VLA(視覺-語言-動作)智駕大模型,目標是於今年下半年實現項目落地。
理想汽車在去年二季度財報電話會議上表示已啓動端到端VLA模型的研究,將兩個模型合二為一,使多模態大模型內化為端到端智駕大模型的一種能力。
那麼,VLA智駕大模型與此前的智駕系統有何區別呢?
VLA智駕大模型結合了端到端和VLM(視覺語言)多模態模型的優勢,能夠提升智駕系統對複雜場景的理解能力,從而提高智能駕駛的精準度。
與端到端大模型相比,VLM對圖像和場景的理解能力更強,但端到端大模型存在決策不可解釋以及難以處理部分場景的缺陷。
當前,VLA是智能駕駛領域的核心競賽之一,理想汽車、吉利汽車和元戎啓行都在積極推動其落地。
然而,VLA的落地面臨較大挑戰,除了模型研發需要時間外,目前市面上的芯片性能大多無法支持其運行。
不過,英偉達即將量產的Thor系列芯片有望解決這一問題。
