百度的開放,不僅僅是種姿態

市場資訊
02-28

對大企業來說,保守不單單是因循守舊,更多時候,則是無法與昨日成功的自己,奮力作別。

可面對未來,百度還在持續張開懷抱。

2月28日,百度官方公衆號宣佈,將於3月16日發佈文心大模型4.5,繼續自身開放的戰略轉軌,並且,一些更加明朗且積極的信號,也在該事件中悄然傳出。

按照百度的說法,即將全面開放的文心大模型4.5,將是百度最強的下一代大模型。尤其在基礎模型能力上,文心大模型4.5將迎來大幅提升,且具備原生多模態、深度思考等能力。

到了今年的6月30日,該模型還將正式開源,這或將帶給用戶更好的體驗,以及對GPT-4.5發起全面挑戰。

不僅如此,算上此次文心大模型4.5推出,以及DeepSeek橫空出世後,百度接連宣佈文心一言免費和上線深度搜索功能,加上旗下搜索、地圖、小度等相繼接入了 DeepSeek,可以說,百度近期打出了系列“開放”的組合拳,無疑正以一種開放的姿態,直面行業的劇烈變化。

而這一切,看似是戰略的轉變,實則,更是一種技術積澱的必然迴響。

百度讓Open Ai臉紅心跳?

在DeepSeek掀起行業開放浪潮之時,百度,無疑是國內響應最爲迅捷的企業之一。

這一次,即將在3月16日發佈的文心大模型4.5,或也將爲行業聚光燈下,對百度“大模型”的期中大考。

不過,據百度方面透露,文心大模型4.5在基礎模型能力上已經有了大幅提升,且具備原生多模態、深度思考等能力,號稱百度最強大模型。

具體而言,此次文心大模型4.5,具有當前行業內幾乎最強的RAG(檢索增強生成)能力,而該能力,也是衡量大模型優劣的重要標準之一。

爲此,百度的RAG,可在大模型理解用戶需求階段,不斷對知識點進行拆解,細化問題。到了檢索階段,又可向大模型展開搜索排序優化,並將搜索返回的異構信息統一表示,送給大模型。

到了最終的生成階段,百度RAG還可綜合不同來源的信息獨自判斷,尤其加上百度實時和全面的搜索生態後,基於大模型邏輯推理能力,就可一舉解決信息衝突等問題,從而生成準確率高、時效性好的答案。

事實上,自文心一言發佈初,百度便一直強調檢索增強,隨後經過近兩年技術沉澱,百度的檢索增強能力不斷提升的同時,也讓該能力的價值,受到業界一致認可。

並且,百度即將推出的文心大模型4.5,更在百度自研的iRAG等技術加持下,可將百度搜索的億級圖片資源與自身強大的基礎模型能力相結合,從而生成種類繁多的真實圖片。甚至,iRAG可以做到在生成特定物品、特定人物以及特定人物與任意背景結合的圖像時,在準確率、真實性上都有顯著突破,極大減少幻覺。

其呈現的整體效果,將會遠遠超過文生圖原生系統,不僅能夠去掉了Ai味兒,而且成本很低,在使用場景上,不論是影視作品、漫畫作品,還是連續畫本、海報製作等領域,無疑帶給用戶留有大量施展才華的空間。

一個可以預見的例子是,在文心大模型4.5正式上線後,用戶如果有品牌宣傳的需求,則可以藉助iRAG技術下,在幾乎0成本操作中,像素極復刻以往大片宣傳海報動輒需要一二十萬,甚至大幾十萬成本的圖片。此外,文心一言還將上線的深度搜索功能,可爲用戶提供專家級內容回覆,實現多模態輸入與輸出。不僅如此,深度搜索功能下,還能提供多項工具調用,包含了高級聯網、文檔問答、圖片理解等功能,在用戶處理多場景任務中,效能無疑將得到極大提升。值得注意的是,先前的2月27日,百度準備發佈文心大模型4.5消息一經公佈,2月28日的凌晨,OpenAi則迅速發佈了GPT-4.5模型。似乎,雙方正在暗自較勁。

不過,OpenAi的發佈或許略顯倉促。據報道,OpenAi前員工安德烈·卡帕西,曾提前體驗了GPT-4.5後,認爲GPT-4.5主要提升在非推理密集型任務上的改進,這些任務多與情商有關,而在數學、代碼等領域,GPT-4.5並不擁有最強的能力。

當然,GPT-4.5與文心大模型4.5雙方具體表現如何,仍有待進一步驗證。

不過,從先前文心一言和ChatGPT對比來看,文心一言在中文語境與本土化上,往往有着GPT難以比擬的優勢:尤其在問答準確性、實時性上,文心一言的幻覺較少,對時事的反應也更加迅捷。

從這點上說,百度的文心大模型4.5的深度思考能力,加上自身極強的多模態功能,對中國用戶而言,或許在未來能有更好的體驗。

例如,從RAG能力實測來看,在國內外主流大模型中,百度文心一言綜合表現一直屬於第一梯隊。即使是春節檔電影細節、春晚節目等內容,文心一言都可以準確回答,做到文能對題,相比之下,OpenAi雖能檢索到信源,卻無法生成準確回答。

更重要的是,文心一言將於4月1日全面免費,PC端和App端用戶均可體驗。與之相對的是,GPT-4.5雖接入API,但OpenAi計劃逐步轉向GPT-5的免費基礎版(額度受限),付費用戶需升級至Plus/Pro版本。

從這點上說,免費且開源的文心大模型4.5,起碼在普惠性上,將帶給用戶更多的誠意。

開放,不僅僅是一種姿態

DeepSeek橫空出世後,浪潮風波席捲全球。

對此,百度卻沒有故步自封,反而動作頻頻,持續以一種開放的姿態,直面變化。

此前的2月13日,文心一言就正式宣佈,將於4月1日起全面免費,所有PC端和App端用戶均可體驗文心繫列最新模型,以及超長文檔處理、專業檢索增強、高級Ai繪畫等功能,一舉引起社會廣泛討論。

一天後的2月14日,百度接着宣佈,將在未來幾個月陸續推出文心大模型4.5系列,以及在6月30日起正式開源。

兩天的2月16日,百度的開放,也延續到了對DeepSeek態度上:彼時,百度將全面接入DeepSeek和文心大模型最新的深度搜索功能。並且,搜索用戶可免費使用DeepSeek和文心大模型深度搜索功能。

在百度全面轉向開源、開放的戰略轉軌下,百度旗下的搜索、地圖、小度等也相繼接入 DeepSeek,由此,Ai浪潮引發產品升級的紅利,也不斷分享到了更多百度系的用戶。

從大模型到搜索,百度的開源、免費,共同打出了一套開放“組合拳”。

從這點上說,在李彥宏帶領下的百度,無疑正展開了一場自我變革,此時,決心和勇氣缺一不可。

更重要的是,在這場開放過程中,又將會帶給用戶、公司、乃至整個行業哪些真正的價值?

對此,先前李彥宏曾談到,開源4.5系列的決策,源自於對技術領先地位的堅定信心,開源將進一步促進文心大模型的廣泛應用,並在更多場景中擴大其影響力:“我想強調的是,無論開源閉源,基礎模型只有在大規模解決現實問題時,才具備真實價值。”

可以說,大模型烈火烹油的兩週後,以OpenAi、百度等爲首的頭部玩家,已將這場大模型的競爭,步步進逼,終於嚮應用層面全面進擊。此時,百度也在用一種更加開放的策略,試圖去佔據大模型第二場的主動權。

而在這場競爭中,更多應用層面的創新,無疑將惠及全球範圍內,越來越多的用戶。

“技術”如何打敗“故事”?

“過去,我們談論摩爾定律時,每18個月,性能水平或價格都會減半。但是今天,當我們談論大語言模型時,增加的成本基本上降低了,可以在12個月內降低90%以上”

百度CEO李彥宏在世界政府峯會上,曾如此說道。

事實上,能夠在DeepSeek衝擊中迅速調整船頭,而不一味固守“閉源”,這既是百度戰略轉折的勇氣,也離不開百度長年以來技術沉澱的支撐。

李彥宏曾談到:“不僅在Ai領域或IT行業,回顧過去幾百年的歷史,大多數創新都與降低成本有關。如果成本降低一定比例,生產力也隨之提高同樣比例,這就是創新的本質。在今天,創新速度比以往都快得多。”

事實上,Ai行業發展至今,“技術實力”正在取代“故事性”,逐漸成爲該行業的核心競爭力。

從這點上說,當下,能夠撐起百度文心大模型強功能、快更迭、免費開源的根本,則源於百度在技術上的底氣。其中,百度在大模型上訓練成本的持續降低,也離不開百度崑崙芯和百舸平臺的助力。

近期,百度智能雲成功點亮崑崙芯三代萬卡集羣,這也是國內首個正式點亮的自研萬卡集羣。據悉,百度智能雲將進一步點亮三萬卡集羣。

值得注意的是, 崑崙芯萬卡集羣具有極強的規模效應,大規模集羣可以通過任務並行調度、彈性算力管理等方式,提高計算資源利用率,避免算力閒置,提高單任務的計算效率,降低整體算力成本,最終實心可大幅提高資源利用率。

這也意味着,在崑崙芯萬卡集羣規模效應的作用下,百度大模型的推理和訓練所需的計算量一直在持續減少,從而直接降低算力成本。

不僅如此,百度的百舸平臺,還能對大規模集羣進行高效的部署管理。

例如,爲解決大模型訓練時高通信帶寬的需求,百度不僅建設了超大規模HPN高性能網絡,還可通過優化的擁塞控制算法、集合通信算法策略,提升了通信效率,將帶寬有效性提升到90%以上。

同時,由於萬卡集羣的能耗極高,常規的散熱方案能耗可達十兆瓦或更高,這將提升企業進行模型訓練的電力成本,爲此,百舸還採用了創新性散熱方案,可以有效降低能耗,進一步降低模型訓練成本。

此外,爲提升GPU 的有效利用率(通常用MFU來表示GPU的有效利用率),百舸還在持續優化並完善模型的分佈式訓練策略,通過高效並行化任務切分策略,將訓練主流開源模型的集羣MFU提升至58%。

以及,爲了保證大規模集羣執行訓練任務的穩定性,百舸提供全面的故障診斷手段,可快速自動偵測到導致訓練任務異常的節點故障。加上百度自研的BCCL,目前已經將故障恢復時間從小時級降低到分鐘級,保障集羣有效訓練率達到98%。

於是,當以上技術形成源源不斷的合力後,到了24年初的財報電話會上,李彥宏則表示,文心大模型的推理成本,已經已降低至一年前的1%。

此次文心大模型4.5能夠迅速推出,最大的原因之一,或許源於推理成本不斷降低。

對此,有觀點指出,百度在模型推理部署上的優勢,尤其是在飛槳深度學習框架的支持下,其中並行推理、量化推理等都是飛槳在大模型推理上的自研技術。受此影響,飛槳和文心的聯合優化,則可以實現推理性能提升,推理成本降低。

而面對機遇與風險並存的未來,人們可以預見的是,文心大模型4.5的推出以及近期百度頻頻開放的動作,遠遠不是終點——

“我們仍需對芯片、數據中心和雲基礎設施進行持續投入,來訓練更好、更智能的下一代模型。”李彥宏曾談到。

(轉自:銀杏科技)

海量資訊、精準解讀,盡在新浪財經APP

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10