加速開放的百度與文心4.5,佔據大模型第二場主動權

極點商業
02-28

無論DeepSeek,還是文心大模型4.5,都已率先進入第二戰場,掀起一場將大模型門檻拉低到極致,推動產業落地、應用爆發的革命性探索。

 作者|劉珊珊

 編輯|Cindy

分隔在大洋彼岸的中美兩大AI企業,同一天宣佈了重磅消息。

2月28日,百度宣佈,文心大模型4.5將於3月16日正式上線。根據百度方面介紹,最新版不僅在基礎模型能力上有大幅提升,且具備原生多模態、深度思考等能力。

“文心大模型4.5,將是百度有史以來最強大的大模型。”此前百度2024年Q4及全年財報電話會上,百度創始人、董事長兼首席執行官李彥宏如此透露。

受來自DeepSeek、百度、阿里等中國大模型的挑戰,OpenAI在北京時間週五凌晨發佈博文,宣佈GPT-4.5大模型正式登場。這款被OpenAI內部代號爲“Orion”的模型,被聲稱是其最大、最佳的聊天模型。

衆所周知,過去幾周全球AI產業界都正因DeepSeek而鉅變。在全球AI競賽加劇之際,作爲中美兩大領先AI企業,百度和OpenAI的新動作,自然更受外界關注。

目前來看,百度將通過文心大模型4.5,打出“開源、免費”組合拳,走向更加開放的策略。

相比之下,GPT-4.5的高情商和人性化表現也帶來了驚喜,但整體差強人意,因爲並不是推理型模型,在性能上也與OpenAI前幾代模型有差距——更強大基礎大模型仍然是護城河邏輯不變下,中國大模型正加速佔據以應用落地爲主題的大模型第二場主動權。

01

開源+免費”,百度更爲開放

進入2月以來,百度已密集放出了多個重磅“AI炸彈”。

2月12日,CNBC一則關於百度文心大模型5.0版本將於下半年發佈的消息,在AI行業引發震動。2月13日,OpenAI首席執行官Sam Altman(山姆·奧特曼)宣佈將在未來幾個月推出名爲GPT-5,中美大模型競賽氛圍越來越濃。

最重磅消息來自百度。同一天,百度宣佈文心一言將於4月1日0時起,全面免費,所有PC端和APP端用戶均可體驗文心繫列最新模型。同時,上線深度搜索功能。

1天后(2月14日),百度宣佈將在未來幾個月中陸續推出文心大模型4.5系列,並於6月30日起正式開源。

這意味着,文心大模型就此打出“免費+開源”組合拳,百度AI策略更爲開放。

百度轉變和DeepSeek橫空出世帶來的震動,有一定關係——但不止百度,OpenAI、騰訊、阿里等國內外AI巨頭,無一不受影響。比如OpenAI,就在中國大模型壓力下,被迫加速模型發佈和開源的腳步。

更客觀現實是,開源和閉源,其實並沒有絕對的優劣之分。

作爲中國大模型最早入局者,百度文心大模型是全球最早對標GPT的LLM大模型,幾年時間裏,文心大模型經過了持續的迭代和進化。比如,文心一言版本已經迭代到了4.0,無論是日均超15億次的調用量,還是在各行業的賦能落地,都是推動中國大模型發展的重要組成部分。

同時,在百度強大生態支撐下,百度搜索、百度地圖、百度文庫、百度智能雲等,都早已在給普通用戶提供最完整的AI服務。

多位業內人士就此認爲,百度走向“開源+免費”,是大模型發展的“順勢而爲”,其意義重大,可以更好地推動技術平權。它讓全球用戶能夠毫無門檻地運用中國頂尖的大模型技術,更是大模型從專業範疇,邁向大衆市場的關鍵轉折點。

李彥宏在多個場合的表態,也表明了,百度如今對開源與閉源模型價值的思考邏輯。“我在過去幾個月中學到的是,開源可以幫助你獲得更多關注。我們正處於AI、生成AI創新的早期階段,更快的傳播將有助於提高採用率,但也有助於更多的人嘗試這項技術。”

這背後,體現的是百度組合拳,推動技術平權時的底氣和開放心態。

比如,百度系多款產品,百度搜索、百度文庫、百度網盤都全量接入了DeepSeek- R1滿血版。相比其他產品入口較深,任何普通網友,都可以在百度首頁搜索框下方,點擊“AI搜索DeepSeek滿血版”直接體驗。

無論如何,自研大模型纔是百度最強競爭力所在。如同李彥宏指出,基礎模型真正的價值,只有在能夠有效解決現實問題並廣泛應用時才能得到體現。“即使是開源,如何確保其在實際應用中展現出色的表現,纔是企業必須面對的挑戰。”

至此,留給外界的疑問,無外這場普惠大衆的AI 變革浪潮,何時正式開啓。

2月27日,路透社爆料稱,百度將在3月中下旬發佈文心大模型4.5 。或許是明顯感受到了來自中國AI的競爭壓力,OpenAI略顯倉促的在2月28日推出GPT-4.5——發佈會僅持續不到14分鐘,OpenAI的CEO山姆·奧特曼正在醫院陪剛出生的孩子,並未現身。

02

史上最強文心大模型,有多強?

隨着文心大模型4.5正式登場日的官宣,接下來半個月中,業界都會有一個共同猜測:史上最強文心大模型,到底有多強?又有哪些能力值得期待?

可以肯定,和GPT-4.5不同,文心大模型4.5,將在基礎模型能力上有大幅提升,帶給用戶最明顯的感受,可能是RAG能力進一步增強,將在幻覺方面降低到新水平。

“幻覺”,是懸在AI發展之路上的達摩克利斯之劍。指的是大模型在試圖生成內容或回答問題時,輸出的結果不完全正確甚至錯誤,即通常所說的“一本正經地胡說八道”。

在大模型領域,由於訓練知識存在偏差、過度泛化地推理、理解存在侷限性等,幻覺是每個模型與生俱來的缺陷。

大模型或多或少都有幻覺問題

例如OpenAI,多份研究此前指出,o3-mini大約只有10個簡單問題中答對1個,兩年來幻覺問題都沒有得到改善。異軍突起的DeepSeek,也因在解答西安安定門繞行問題時 “翻車” 而備受關注。

RAG(檢索增強型生成),在解決幻覺問題上扮演着至關重要的角色——在推理過程中,RAG 使用檢索到的數據作爲參考來組織答案,從外部知識源中動態檢索信息,以此幫助大模型生成更豐富、更準確、更可靠的內容。可以說,RAG給大模型增加了一個可以快速查找的“知識外掛”。

毋庸置疑,在國內,百度擁有最豐富的實時與個性化的數據和知識,研發了“理解-檢索-生成”RAG能力。從各種RAG能力實測來看,國內外主流大模型中,百度文心一言綜合表現最佳。

比如,在和OpenAI的直接PK中,即使是春節檔電影細節、春晚節目等內容,文心都能準確回答;相比之下,OpenAI雖能檢索到信源,卻無法生成準確回答。

基於此,去年11月的百度世界2024大會上,百度發佈了自研的檢索增強的文生圖技術(iRAG),將百度搜索的億級圖片資源跟強大的基礎模型能力相結合,大幅降低圖片生成領域的幻覺,大幅提高了文心的模型可用性。

可以預計,在文心大模型4.5中,隨着大模型的訓練數據得到進一步擴充,AI幻覺也會大幅降低,不僅讓百度自身AI應用快速進化,也能夠讓更多行業放心用上大模型。

近期,文心一言就上線了“深度搜索”功能,具備專家級問答能力,RAG能力突出,尤其是專業領域問答幻覺率低。

在OpenAI的GPT-4.5不具備推理能力,還是主打寫作等文本生成趨勢下,文心大模型4.5究竟能呈現怎樣的原生多模態、深度思考能力?以及可以在哪些場景下落地應用?顯然更值得期待。

可以推測,在DeepSeek掀起大模型降價浪潮後,文心大模型4.5也會加速推動性能升級與成本降低,有望催生新的商業模式和產業生態。

值得一提的是,得益於飛槳和文心的聯合優化,文心大模型在推理性能提升同時,推理成本也得到了有效降低——根據去年世界大會上的說法,其推理成本一年降低99%。

從李彥宏演示的個例來看,以前拍一組汽車在某場景的大片宣傳海報動輒需要一二十萬,甚至大幾十萬,使用iRAG後,創作成本接近於0。

推理成本降低速度還在加快。李彥宏在阿聯酋迪拜出席“世界政府峯會”上表示,“在過去,當我們談論摩爾定律時,每18個月,性能水平或價格都會減半。但是今天,當我們談論大型語言模型時,增加的成本基本上降低了,可以在12個月內降低90%以上。”

所以,這也是衆多企業和開發者,對於文心大模型4.5的共同期待。一位開發者就說,基於文心大模型4.5,希望無論是開發原生應用,還是做二次開發,都能夠方便地體驗,擁有更低的推理成本和更高的訓練效率。

03

第二場競速,

中國大模型趕超美國提速

上述開發者的期待,其實正是在百度接連打出“開源+免費”組合拳後,李彥宏的表態:“希望客戶和用戶能比之前更方便地體驗這款模型。”

某種程度看,無論DeepSeek,還是文心大模型4.5,都已率先進入第二戰場,掀起一場將大模型門檻拉低到極致,推動產業落地、應用爆發的革命性探索。

中國是全球唯一擁有聯合國產業分類中所列全部工業門類的國家,不僅擁有全球最多的C端用戶,還有最廣闊的B端市場,對AI應用落地來說,這是獨特的巨大優勢。

如何讓大模型更好應用於千行百業,全面升級產業同時,創造一個巨大商業市場,是自上而下的共識。權威媒體就在評論中認爲,大模型落地應用,是中國AI當下最重要的命題。

“作爲生產力工具,以大模型爲代表的AI技術,不僅將與營銷、文娛、社交、電商等AI原生應用深度融合,還會重構、改造傳統制造、醫療、HR、教育、金融、法律等垂類應用,推動千行百業向高質量方向發展。”一位觀察人士說。

過去十餘年來,美國或許一直在AI競賽中領先中國。但從DeepSeek到文心大模型4.5,這一切正在迅速改變:

儘管OpenAI等明顯感受到了來自中國的競爭壓力,也在想方設法提速,但GPT-4.5“最佳聊天的小家子氣”——GPT 4.5(研究預覽版)甚至輸出價格是每百萬token 150美金相比,依然讓更多美國AI人士相信,這標誌着在大模型第二場競速,也就是應用落地比拼中,中國大模型正不斷趕超美國。

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10