中國人工智能初創公司DeepSeek引領的強化學習和小模型發展的技術創新震撼了全球市場,這一新思路可能引來大量初創公司的效仿,讓“鉅額現金儲備能創造無可爭議的優勢”這一論點變得更爲複雜。而這對於人工智能巨頭意味着什麼?
就在硅谷對DeepSeek“Aha一刻”(“頓悟一刻”)的熱議聲中,當地時間1月29日,Meta和微軟兩家人工智能巨頭公司公佈了新一季度財報,兩家公司的高管都在財報會上提及DeepSeek。截至目前,Meta並未削減與人工智能投入相關的支出,並計劃今年向AI投入600億至650億美元。微軟表示AI成本下降將是趨勢,該公司還預計2026財年資本支出增長率將低於2025財年。
投資基礎設施是一種“戰略優勢”
Meta首席執行官馬克·扎克伯格週三表示,現在判斷DeepSeek的突破性AI模型將對Meta及更廣泛的科技行業產生何種影響還爲時過早。
扎克伯格還強調,對於大型企業而言,隨着時間的推移,在資本支出和基礎設施上進行大量投資將成爲一種“戰略優勢”。“我敢打賭,構建這種基礎設施的能力將是一個主要優勢。”他說道。
“雖然公司最終可能需要更少的計算資源來訓練這些強大的模型,但當軟件在實際運行和執行操作時,擁有大量的服務器的能力可能是必要的,這將有助於實現更高水平的智能和更高質量的服務。”扎克伯格在與分析師討論DeepSeek的最新進展時表示。
他進一步稱,爲所有人提供服務的成本會很高。以Meta爲例,該公司第四季度日活用戶數量超過33.5億。
扎克伯格的表態與此前OpenAI的CEO奧爾特曼以及Meta首席AI科學家Yann LeCun的表態相呼應。奧爾特曼稱,計算資源“現在比以往任何時候都更加重要”。LeCun也表示:“爲數十億人提供AI助理服務仍需要大量計算能力。”
DeepSeek已經證明構建尖端AI模型所需的資金和計算資源比之前預計的可以少得多。但Meta的最新財報中仍然計劃今年向AI投入600億至650億美元,2025財年的總支出預計將超過1140億美元。Meta股價當天收盤上漲2%。
扎克伯格稱,Meta仍在消化DeepSeek的一些“驚人之舉”,他的團隊希望最終將其中的一些進步應用於Meta自己的AI項目。
“Meta將從DeepSeek等技術中繼續學習,並不斷優化發佈自己的免費開源AI模型Llama,以推動行業發展。”扎克伯格說道。
同日,微軟也發佈了最新季度財報。微軟此前已經承諾將在本財年爲人工智能數據中心預留800億美元的支出。對此,微軟首席執行官薩蒂亞·納德拉表示,這筆支出是爲了克服阻礙微軟利用人工智能的能力的產能限制。
納德拉在與分析師的電話會議上表示:“隨着人工智能變得更加高效和普及,我們將看到需求呈指數級增長。”不過該公司預計支出將在7月1日開始的2026財年逐漸放緩。
微軟首席財務官Amy Hood表示,該公司本季度和下一季度的資本支出將保持在第二季度約226億美元的水平。“在2026財年,我們預計將繼續在強勁需求信號下進行投資。不過,增長率將低於截至6月底的2025財年。”她說道。
無論是Meta還是微軟,在人工智能鉅額支出面前,缺乏回報是資本市場最大的擔憂。微軟股價在盤後交易中下跌超過5%。微軟財報顯示,Azure雲業務增長低於預期。
Futurum Group分析師Daniel Newman表示:“由於這些鉅額支出,他們需要在創收方面加大力度,但我認爲就目前的人工智能而言,資本支出過多,消費不足。”
週三微軟公佈季度業績後,納德拉在投資者電話會議上表示:“DeepSeek確實有一些創新。顯然,現在一切都商品化了,它將得到廣泛應用。”
他還表示,爲了擴大AI的應用,微軟與OpenAI合作做了很多工作。納德拉補充說道:“僅僅發佈最好的新模型是不夠的。你必須讓它具有成本效益。如果服務成本太高,那就不好了。”
“Aha一刻”或引衆創新公司效仿
DeepSeek的AI模型之所以能舉世矚目,是因爲該公司採用了創新技術開發了一種在有限人工干預下進行訓練的人工智能模型,AI的這一“頓悟時刻”可以降低開發人員基於該技術構建“殺手級”應用程序的成本。
DeepSeek表示,當模型重新評估答案並調整處理時間以解決不同問題時,它發現該模型出現了該公司所謂的“頓悟時刻”。DeepSeek的創建者在他們的研究論文中寫道:“‘頓悟時刻’有力地提醒了我們,強化學習有可能在人工智能系統中解鎖新的智能水平,爲未來更加自主和自適應的模型鋪平道路。”
讓聊天機器人生成更有用的響應的一種方法是“從人類反饋中強化學習”(RLHF),這是OpenAI爲改進ChatGPT而首創的一種技術。但這一步通常費力、昂貴且耗時,通常需要一支人工數據標記員隊伍。DeepSeek 的重大創新是使用一種稱爲強化學習(RL)的技術來自動化這最後一步。
人工智能研究公司Hugging Face研究員Lewis Tunstall表示:“要實現這一目標,祕訣似乎就是擁有一個非常強大的預訓練模型,然後擁有非常好的基礎設施來大規模進行強化學習過程。”
“智能的祕訣非常簡單。”Hugging Face聯合創始人兼首席科學官Thomas Wolf表示,“DeepSeek的技術已被該領域的其他人所理解,我預計很多團隊可以重複它們的工作。”
有AI專家認爲,DeepSeek展示了“真正的創新”,而且該公司在技術上採取透明的策略,公開詳細的技術報告,概述它是如何構建推理模型的做法值得稱讚。
英國劍橋大學首任DeepMind機器學習教授Neil Lawrence表示,DeepSeek發佈的模型可能只是“冰山一角”。“歷史表明,大公司在擴大規模時很難創新,我們從許多大公司看到的是用計算投資取代智力上的辛勤工作。”他說道。
TechInsights分析師G Dan Hutcheson在一份報告中稱:“我不認爲DeepSeek最有可能威脅英偉達,而應該更會影響到試圖靠賣人工智能產品來賺錢的公司,比如OpenAI。”
此前,英特爾前CEO帕特·基辛格(Pat Gelsinger)在LinkedIn帖子中表示:“市場的反應是錯誤的,降低AI成本將擴大市場應用。DeepSeek是一項令人難以置信的工程,將引領AI更廣泛地被採用。”
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。