在31日的百度AI Day上,文小言宣佈完成品牌煥新與功能升級:品牌視覺上換了套“皮膚”,顯得更加年輕和清新;功能升級上聚焦模型開發與功能創新,支持多模型融合調度,升級全新語音大模型、圖片問答、AI 生圖生視頻等多項能力。
百度對外介紹新文小言時,十分形象的描述:“如果TA聰明、理解能力強、很會找話題,又很年輕,介紹給你,你願意認識一下嗎?”
文小言再升級
文小言此次升級的核心亮點在於“多模型融合調度”。通過整合百度自研的文心X1、文心4.5等模型,並接入DeepSeek-R1、可靈等第三方優質模型,文小言實現了多模型間的智能協同。
需要補充的是,文心X1發佈僅半個月,百度稱其是“首個自主運用工具的深度思考模型”;文心大模型4.5是百度自主研發的新一代原生多模態基礎大模型,在多模態交互、理解方面更強,原生模型聯合預訓練能實現更深層次的模態融合。
得益於“自研+開源模型”的組合,用戶擁有了選擇權,切換到“自動模式”,就可一鍵調用最優模型組合,或根據需求靈活選擇單一模型完成特定任務,大幅提升響應速度與任務處理能力。
這也讓文小言擁有了更強的“大腦”。以裝修方案爲例,輸出prompt:我的客廳朝向是南偏東,35平米,有一整扇落地窗,請根據我的要求畫出淺色奶油風、暗黑輕奢風、跳脫童趣風這三種不同風格的裝修效果圖,三個戶型必須一致。
我選擇文心X1模式,文小言就能根據需求點,生成多種裝修風格的方案,設計原理、效果圖一應俱全。它在推理過程中,圖文並茂、自如調用工具的能力讓很多人都眼前一亮。
根據百度此前介紹,文心X1利用遞進式強化學習訓練方法、基於思維鏈和行動鏈的端到端訓練、多元統一的獎勵系統等技術。也可以理解爲,這是百度自研大模型的獨門絕招,文心X1的推理輸出是直接可以圖文混合連續完成任務。
多模態理解能力上,文小言再度增強圖片理解能力。比如短視頻平臺上有一類比較熱門的挑戰:根據圖片猜測街景或者所在位置。發起者所上傳的圖片,標誌性、辨識度以及信息量都不是很高。文小言能夠很快並準確的分析出答案。
還有“中午喫什麼”的世界難題,只要你拍下菜單,告訴它類似的需求:兩個人有兩百塊人民幣預算,想要喫得豐富些,應該怎麼點餐?文小言在極短的時間內,就能給出一個滿意的解決方案。
文小言還進一步提升了全新語音大模型、圖片問答、AI 生圖生視頻等能力。比如,全新語音大模型支持方言對話、複雜知識問答及隨時打斷等場景,用戶可進行語音知識問答或趣味角色扮演。
以小朋友和小言的對話爲例,銜接絲滑,不用擔心打斷後,AI接不上話。還能切換蠟筆小新、孫悟空、熊大熊二等百變音色。不僅如此,其還學會了多種方言。重慶話、河南話、廣西話等等都能聊。
圖片問答功能讓用戶可以通過拍攝或上傳圖片,以文字或語音提問直接獲取深度解析。例如,拍攝一道數學題可實時生成解題思路與視頻解析;上傳多款商品圖可對比參數、價格,輔助購物決策;拍攝杯子設計圖後,AI 可自動解析風格並生成同款手機殼、支架等周邊產品。
值得一提的是,新增的“圖個冷知識”功能更富趣味性,用戶可預設“歷史學者”“科技達人”等人設視角,爲同一圖片賦予多維解讀。例如,當用戶詢問“貓窗探祕,爲何貓愛窗邊的科學真相?",文小言能從狩獵本能、能量獲取、領地意識等角度給出獨特解讀。
百度找到做AI to C節奏
回溯來看,這應該是文小言兩年來的第二次大規模升級。
2023年3月16日,百度只比OpenAI晚了不到四個月,就推出類ChatGPT生成式AI產品“文心一言”,拉近中國科技公司與海外AI大模型企業的差距。
2024年9月4日,百度把養了一年半的文心一言App升級爲“文小言”,其定位也明確爲“百度旗下新搜索智能助手”。當時,文小言推出富媒體搜索、多模態輸入、文本與圖片創作、高擬真數字人等“新搜索”能力;同時,獨家首發記憶和自由訂閱等新功能。
這次產品升級和定位折射出百度的野心:延續其在傳統搜索上的優勢,再次定義新搜索。官方認爲,區別於其他搜索產品,AI時代的新搜索需要具備AI能力,包括生成式AI、多輪交互、個性化互動、智能體等多元功能。
也就是說,一款合格的“新搜索智能助手”,除了具備傳統的信息檢索能力,還應該滿足用戶在搜、創 、聊等多層次的需求,具備更像人、更懂人的特點。
文小言是百度在AI to C上邁出的關鍵一步,其在搜、創、聊等多個維度實現了對搜索行業的變革。並且,單從名字上看,它的擬人屬性就擺在顯要位置,在傳播上大幅弱化過往百度產品濃重的“工具屬性”,與普通用戶更有“路人緣”。
我還注意到一個業務動向,文小言完成升級後不久的10月,百度召開了2024年第三季度總監會。第三季度通常是百度的戰略季,李彥宏和百度總監級以上管理人員都會參加,可見其重要性。
李彥宏在會上作了近萬字的發言,爲百度未來一段時期的業務戰略定調以及作思想動員。其中,他提到,“文小言”沒有必要像豆包、Kimi一樣激進推廣。後續半年,文小言一直“低調發育”,直到此次再度煥新。但其用戶規模、產品體驗友好度,一直居於同類產品相關榜單的前列。
還有比較重要的一點是,基於對搜索的全新認知,李彥宏認爲,搜索的重構和重建應該分成兩步:
首先是搜推融合。他強調,搜索做任何的改變,不僅要看對搜索場景下核心業務指標的影響,也要看對Feed這個核心業務指標的影響。空框推薦(比如百度搜索框中會預置一些詞和句子)的本質是一種推薦,因爲這個詞不是由用戶來Input的,只有用推薦的理念來做纔是正解。
其次,AI要和移動生態結合。AI需要跟移動生態做進一步融合,比如圖像用戶界面和自然語言界面怎麼結合會更自然,這會是未來搜索發展的一個範式。
我一直認爲,AI to C需要解決兩個關鍵問題:用戶體驗和商業模式。因爲只有在這兩方面取得突破,基於不斷優化使用體驗的前提,讓AI解決真實場景的用戶需求,AI to C才能被用戶接受並忠實的留存,進而產生商業價值。
文小言的兩次升級,都沒有偏離李彥宏設定的兩步走策略,也符合這個邏輯。它在不斷融合百度移動生態,比如集成諸多智能體,爲用戶提供服務。同時,百度也鼓勵用戶創建自己的智能體,並進行分享。爲此,百度還設立社區模塊,打造交流平臺,交流創作經驗。
不僅如此,文小言也在融合百度體系內外的技術能力。在此基礎上,文小言滿足了百度對新搜索的定義。百度也在這個過程中,找到做AI to C產品的節奏:生態層開放,場景層深耕,價值層進行重構。
百度相關負責人在活動現場對唐辰表示,過去 AI App 是模型的展示場,但這對於普通人是不夠的。模型就像引擎,但普通用戶要的是車,就還得加上車架和座椅,才能滿足舒適的駕乘體驗。
在體驗和交流過程中,我明顯感覺到,百度想“開”了之後,其AI To C的產品氣質和節奏,正在發生肉眼可見的變化,有一種甩掉包袱的輕快。就像李彥宏在百度產品接入DeepSeek後表示,“百度希望和大家一起,推動人工智能技術進步,讓所有人都能使用最先進的生產力工具,讓所有人都能從中受益。”
這或許也是百度持續升級文小言的意義。
但不可避免的,百度AI to C產品還存在着一些慣性問題。比如在功能設計上,百度十分慷慨,希望把自己所有的好技術成果都呈現在用戶面前。但面面俱到也並見得是好事,無形中拉高了用戶的使用門檻。我在使用搜題功能中,按照提示尋找上傳問題的入口,花了很長時間。結果在對話框上方,“解題老師”的快捷入口已經被單獨列出來了。
對百度來說,節奏對了,剩下的調試,就是在與時間賽跑,與友商賽跑了。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。