AGI時代下,未來汽車出行會是怎麼樣的?在2025上海車展開幕之際,新民晚報記者採訪了商湯科技聯合創始人、首席科學家、商湯絕影CEO王曉剛。商湯絕影是最專注於汽車行業領先的AI公司,旨在推動智能汽車加速駛入通用人工智能時代。
在他看來,“未來汽車”要實現更爲自然的、有溫度的人車交互體驗,讓智能汽車從出行代步工具,進化爲有情感的家庭新成員;同時它還能結合世界模型,持續提升輔助駕駛的性能,讓駕駛安全更有確定性。
新民晚報:AGI賦能下,會給智能汽車帶來哪些主要變革?
王曉剛:我認爲主要在三方面:第一是通過原生流式多模態大模型帶來的人機交互體驗的變革;第二是通過端到端智駕技術的升級,帶來極致自動駕駛安全和效率;第三是艙駕融合驅動智能汽車往超級智能體方向演進,極大拓展了人與物理和數字世界的連接。
在智能汽車的應用部署上,絕影制定了端雲協同的部署策略,通過意圖分流來進行任務在端雲兩側的協同,當前場景任務有80%是在端側處理。端雲協同的方式可覆蓋廣泛的場景交互,保證安全可靠、實時響應,並充分保障個人隱私安全。
新民晚報:在“艙—駕—雲”三方面,絕影提供了哪些被業界廣泛認可的解決方案?
王曉剛:在智能駕駛領域,我們在2022年發佈了行業首個感知決策一體化的輔助駕駛通用模型UniAD,這是和特斯拉FSD一樣的一段式端到端方案,獲得2023年國際計算機視覺與模式識別會議的最佳論文,引領行業的潮流。今年,我們又發佈了行業首個與世界模型協同交互的端到端智駕技術方案R-UniAD,讓世界模型和強化學習框架相結合,構建生成式智駕新範式,這也是今年行業都非常認可的技術方案。
面向智能座艙,我們打造了新一代座艙情感引擎New Member“家庭新成員”,能夠察言觀色、無時不在、與你心有靈犀,讓每一輛車擁有“有趣的靈魂”,這個產品得到很多認可,不少車企也在之後發佈了類似的概念,這款產品已經在知名車企量產交付了,今年車展我們也進一步升級,發佈行業首個專爲車載AIOS打造的AI內核“絕影千機”,助力New Member實現突破性技術升級。
我們還有更多的AI產品也都是創新性的,比如我們有一個全場景健康管家產品,3月分量產上車了星途攬月,是行業首個量產上車的醫療AI大模型產品。
新民晚報:現在是大模型的時代,大模型爲智能汽車的發展帶來了哪些助力?
王曉剛:絕影打造了世界模型“開悟”——它可以理解真實世界中的“物理法則”和“交通規則”,並在此基礎上,能夠生成“準確”的場景。具體來說,生成的視頻是11V時空一致的,時間最長可以達到150秒,分辨率能夠達到1080P;同時,“開悟”生成的場景也是可控的,能細微到“元素級別”,生成場景非常精細,完全滿足端到端模型訓練和仿真對於數據質量的高要求。
“開悟”生產數據的效率很高。對比行業平均水平,我們進行過測算,基於1張 A100 GPU,“開悟”世界模型平均每天的數據生成量,相當於100臺路測車的數據採集能力,比得上500臺量產車的效率。
世界模型開悟
上海車展上面,“開悟”世界模型也升級到了2.0版本,結合強化學習框架,能夠實現端到端算法和世界模型的協同交互,打破數據瓶頸,讓輔助駕駛的安全更有確定性。
New Member(家庭新成員)背後則離不開多模態大模型的支持,絕影的原生流式多模態大模型讓世間萬物都可被感知、被理解、被交互。商湯最近發佈了日日新V6多模態大模型,我們也實現了端側部署,New Member也有突破性的技術升級,能夠做到多模態識人,汽車不僅能夠認識你,還可以理解你,不再是被動響應,而是成爲一個懂你、會揣摩你心思的“聰明搭子”,能夠真正參與到座艙內的多人多輪對話當中,既不過度打擾,但又能時刻陪伴。
我們的New Member是通過集成了大語言模型、多模態大模型還有記憶框架等AI能力,才能實現察言觀色、無時不在、與你心有靈犀的交互,讓每一輛車擁有“有趣的靈魂”。
(文章來源:上觀新聞)
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。