新浪財經北美站 康路
在大模型進入深水區、AI Agent走向爆發的2025年,企業對“AI+業務”的落地路徑關注前所未有。
近日,新浪財經在NYU中美高峯論壇期間,對話阿里巴巴通義實驗室自然語言處理方向負責人黃非,圍繞模型能力演進、Agent範式變革、多模態翻譯出海、代碼智能化等趨勢,展開交流。阿里通義實驗室是國內最早從事大模型研究的團隊之一,研發的通義系列模型和產品在大模型開源社區和產業界學術界廣受好評。黃非分享了阿里通義實驗室在大模型與AI Agent方向上的實踐路徑與戰略判斷。
“第一條是圍繞模型能力本身的突破。”黃非指出,“比如我們做通義千問的時候,一條主線就是探索大模型的智能邊界。這條線並不是以應用驅動爲主,而是以‘能力上限’爲目標,比如說在各種 benchmark (基準)任務上不斷提升效果,研究怎麼選更優的數據、更有效的訓練策略、更強的架構。這其實就是往 AGI 的方向去推。”
但與此同時,通義也在更貼近業務場景的方向發力。
“第二條就是更貼近應用端的路徑,也就是你說的‘業務系統協同’。像通義曉蜜這樣的智能對話助手長期以來服務包括電商、政務、運營商等各行各業,還有我們開發的通義靈碼(代碼生成助手),目前在國內的市場佔有率是第一的。我們也在研發法律助手通義法睿、角色陪伴類的大模型通義星塵等產品。這類應用其實就是模型能力和業務場景的結合。”
針對Agent的方向,黃非表示,傳統Agent通過人工設定流程來完成任務,但泛化能力不強。“我們現在想做的是讓模型自己學會‘什麼時候該調哪個工具’,比如用計算器、查天氣、調地圖API,這些其實都是Agent的工具調度邏輯。這方面我們正在做系統級探索。”
在談到多模態翻譯如何服務阿里全球化時,黃非舉例指出,通義已經在跨語種直播帶貨中取得實質進展。中國主播在直播帶貨過程中,可以實時將內容轉成英語、西語、阿拉伯語等多種語言,大幅降低了語言壁壘。
而在電商商品出海過程中,通義也已從“翻譯”走向“本地生成”。黃非解釋道,當一件中國商品要賣到西語市場,不能只把文字翻譯過去,還要重寫產品描述、重新生成營銷圖片和短視頻,讓當地用戶覺得內容就是爲他們量身打造的。
“這背後其實是一整套跨語言、跨模態的智能生成鏈條。”黃非說。
作爲通義自然語言方向的長期負責人,黃非分享瞭如何判斷某個AI方向具有“長期勢能”的思考框架,“我們的判斷邏輯也很清晰:第一,看這個方向是不是具有系統性價值,能不能通過解決一類問題帶來巨大的業務價值,因爲專注才能突破;第二,看它是不是有技術壁壘,不容易被別人複製。如果只是一個“誰都能做”的方向,門檻比較低,那我們的技術優勢和團隊人才優勢就不夠彰顯。”
通義一直堅持開源開放的路線。“我們相信AI技術的發展是在不斷開放的基礎上持續進行,開源開放一方面可以降低千行百業使用AI大模型的門檻,同時也可以和產業界和學術界的專家學者們共同合作推進AI技術的不斷發展,推進智能的上限。科技普惠,AI向善,讓技術呵護人間煙火也是我們的持續目標。” 黃非最後指出了有溫度又有人情味的AI的願景。
附對話實錄:
新浪財經:當前業界正在從“大語言模型”快速轉向“AI Agent”範式。在阿里體系中,Agent 是更強調增強對話智能,還是強調與業務系統的深度協同?
黃非:我覺得是兩條路徑。
第一條是圍繞模型能力本身的突破。比如我們做通義千問的時候,一條主線就是探索大模型的智能邊界。這條線並不是以應用驅動爲主,而是以“能力上限”爲目標,比如說在各種 benchmark (基準)任務上不斷提升效果,研究怎麼選更優的數據、更有效的訓練策略、更強的架構。這其實就是往 AGI 的方向去推。
第二條就是更貼近應用端的路徑,也就是你說的“業務系統協同”。像通義曉蜜這樣的智能對話助手,還有我們做的通義靈碼(代碼生成助手),目前在國內的市場佔有率是第一的。我們也在研發法律助手通義法睿、角色陪伴類的大模型通義星塵等產品。這類應用其實就是模型能力和業務場景的結合。
你可以把前一條理解成“模型本身有多聰明”,而後一條是“聰明的大腦怎麼完成具體任務”。這裏面就包括你提到的 Agent 方向,比如說流程化任務建模、工具調用,甚至解決那些模型以前處理不了的開放性問題。
舉個例子, Manus 是通過對人工預先設定流程解決問題的,但泛化性有待加強。現在我們希望模型通過學習掌握這些流程,實現更通用的 Agent 能力。什麼時候用計算器,什麼時候查天氣、調地圖 API,這些其實都是 Agent 的工具調度邏輯。總的來說,這兩條路徑我們是同時在走的:一方面持續打磨底層模型能力,另一方面在具體場景中做系統級的落地。
新浪財經:多模態翻譯如何支撐阿里“國際化業務”的技術根基?是否可以分享幾個典型應用場景,如商品跨語種描述、電商直播?
黃非:電商直播就是一個非常典型的例子。我們其實早在 2020年就上線過一個面向電商直播的實時翻譯系統,雖然當時技術還不成熟,還有很多提升空間。但到了現在,大模型技術發展得非常快,比如通義現在可以支持接近 100多種語言,其中主流的幾種語言——英、中、西、法、德、日、韓、俄、印尼語和阿拉伯語等語言的理解生成翻譯能力都處於業界一流。
這意味着,一箇中國主播在用中文講解商品的時候,可以實時把語音或文字內容翻成不同語言,大幅降低語言壁壘。
再比如商品本地化。很多中國商品在淘寶上展示的內容是中文圖文,但當我要把它們賣到西語市場的時候,就需要重新生成貼合當地用戶審美和語言習慣的商品描述、營銷圖片和介紹視頻。
這就不僅是翻譯的問題,還要包括圖片生成、營銷文案自動生成等,我們希望讓西語用戶在電商平臺上看到這些內容時,覺得是“本地的”,而不是“翻譯過來的”。這背後其實是一個跨語言、跨模態的智能生成鏈條。
新浪財經:作爲技術負責人,您如何判斷一個AI方向具有“長期勢能”?
黃非:這個問題特別重要。我覺得核心是:你要清楚今天模型能做什麼,未來一兩年又會發展到什麼程度。這個判斷要基於對技術本質的理解、對演化趨勢的敏感度和對落地場景的把握。
比如我們團隊特別早就判斷代碼生成是一個值得投入的方向。兩年前我們就開始做通義靈碼,現在它是國內做得最好、用戶數最多的代碼助手。很多廠商到現在才意識到代碼生成的重要性,但我們已經有了先發優勢,能跑得更快。
我們還在很早就押注了像聯網搜索、RAG(檢索增強生成)這樣的方向。大模型的訓練數據都是靜態的,那要獲取實時信息,就必須讓模型學會怎麼查詢互聯網、怎麼判斷信息質量、怎麼把它整合成可靠答案。這是大模型必需的一環,我們很早就組織人力去做了。
我們的判斷邏輯也很清晰:第一,看這個方向是不是具有系統性價值,能不能解決一類問題,因爲專注才能突破;第二,看它是不是有技術壁壘,不容易被別人複製。如果只是一個“誰都能做”的方向,門檻比較低,那我們的技術優勢和團隊人才優勢就不夠彰顯。
新浪財經:爲什麼代碼你覺得是很重要的底層能力?
黃非:有兩個原因。
第一,代碼場景的學習反饋機制特別好。就像數學一樣,編程的正確與否可以被立即驗證。你寫了一段代碼,要麼成功執行,要麼直接報錯,這種強反饋對模型訓練是非常理想的。
第二,代碼本身就是連接現實世界的橋樑。它可以調用數據庫、控制硬件、構建前端頁面調動後端服務……幾乎所有複雜系統都需要代碼作爲接口。
更重要的是,我們的目標並不是讓程序員更高效,而是讓“不是程序員的人”也能寫代碼。比如一個產品經理、運營、記者甚至小學生,如果他們能通過自然語言對話讓大模型生成代碼或者應用,解決實際問題,他們就有了更強大的驅動數字世界和物理世界的能力。
現在在美國有個概念叫“Vibe Coding”,就是說你通過自然語言讓大模型生成代碼應用,把需求變成結果。我們覺得這是很有未來感的方向,大模型可以變成每個人的數字開發助手。
新浪財經:年輕一代如何在AI浪潮中選擇參與路徑:技術、產品還是創業?
黃非:這個就得看個人的背景和興趣了。
如果你是計算機相關專業的研究生、博士生,已經掌握了機器學習、深度學習這些基本能力,而且有一定算力條件,那你當然可以選擇做底層模型研究,這是門檻高但回報大的路徑。
如果你不是技術出身,那也沒關係。現在很多應用場景其實都可以用大模型來解決痛點。關鍵是你能不能發現“哪些問題是大模型現在能解決的”,解決之後又能創造什麼價值。如果你能理解這些機會,你就可以去做產品,甚至創業。
如果你還不確定方向,那我建議最起碼要學會使用大模型。比如我女兒現在學習遇到不會的題目,我不是讓她直接問答案,而是問模型怎麼解、用什麼知識點、能不能再出一道類似的題再練一遍。這其實就是把大模型當成AI助教。
我相信大模型的使用會越來越普及。你越早上手,越能知道它能做什麼、不能做什麼,越能知道自己哪些能力可能被替代,哪些能力是AI幫你強化的。這種覺察,對未來每個人都特別重要。
新浪財經:通義開源了一系列大模型模型,也支持建設了國內領先的AI模型開源社區魔搭。通義在選擇開源和閉源方面有什麼考量?
黃非:通義一直堅持開源開放的的路線。隨着一系列全尺寸多模態大模型的開源,通義千問的系列模型超越Llama成爲全球最廣泛衍生的開源大模型家族。我們也在魔搭社區開源了數百個傳統AI的NLP, 語音,視覺相關的模型。因爲我們相信AI技術的發展是在不斷開放的基礎上持續進行,我們把最好的模型開放出來,一方面可以降低產業界千行百業使用AI大模型的門檻,普惠大衆,同時也可以和學術界的專家學者們共同合作推進AI技術的不斷發展,推進智能的上限,也充分理解AI技術的優勢和風險。科技普惠,AI向善,讓技術呵護人間煙火也是我們的持續目標。
新浪聲明:所有會議實錄均爲現場速記整理,未經演講者審閱,新浪網登載此文出於傳遞更多信息之目的,並不意味着贊同其觀點或證實其描述。
責任編輯:梁斌 SF055
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。