專題:國民財富發展研究合作平台2025春季峯會

4月10日金融一線消息,以「人工智能與金融未來」為主題的國民財富發展研究合作平台2025春季峯會在京召開。第四範式創始人戴文淵在主題論壇中表示,AI一直以來都是在訓練、推理之間來來回回不斷變化的一個過程。最早的DeepBlue(深藍)就是一個典型的以推理為主的AI模型;再到像watson,就是第一次人機問答的對戰,那個時候就是以訓練為主,當時用AI去學了維基百科的知識,在問答的過程當中贏了人。再到AlphaGo,因為圍棋的數據量一共歷史上就30、40萬盤,你去基於這30、40萬盤的棋,能訓練的也有限,所以其實AlphaGo也需要很強的強化學習的能力。再到ChatGPT,就拉回到訓練周期了,因為那個時候叫作大力出奇跡,拿海量的語料訓練大參數的模型。
「到現在為什麼又回到了推理的周期呢?實際上不是說訓練沒用,是因為再擴大一個數量級、兩個數量級的高質量語料的數據已經很難了,或者說代價太大了,如果做一個類比,如果我們把人工智能當作我們去考試,我要在考試當中取得一個好的成績,有兩種方法,一種是我在家裏拼命地做習題,還有一種就是我考試的時候多想一想。對於從經濟的角度來說,如果我能訓練就不推理,我能在家裏多做點題,我就不在考場上去想。但現在的問題是家裏的題已經做完了,已經沒有辦法在家裏做更多的題了,所以就進入到推理的周期了。DeepSeek大家聽到更多的叫深度推理,大家會發現你問DeepSeek個問題,有的時候它要想一到兩分鐘,甚至更久,就是你不是在家裏學的,是現場想的。」戴文淵進一步表示,但是進入到推理周期這句話其實既對也不對,實際上真正進入到推理周期的是大語言模型,不是說所有的AI都進入到了推理周期,有很多AI的領域,還應該做更多的訓練。
責任編輯:秦藝