在31日的百度AI Day上,文小言宣布完成品牌焕新与功能升级:品牌视觉上换了套“皮肤”,显得更加年轻和清新;功能升级上聚焦模型开发与功能创新,支持多模型融合调度,升级全新语音大模型、图片问答、AI 生图生视频等多项能力。
百度对外介绍新文小言时,十分形象的描述:“如果TA聪明、理解能力强、很会找话题,又很年轻,介绍给你,你愿意认识一下吗?”
文小言再升级
文小言此次升级的核心亮点在于“多模型融合调度”。通过整合百度自研的文心X1、文心4.5等模型,并接入DeepSeek-R1、可灵等第三方优质模型,文小言实现了多模型间的智能协同。
需要补充的是,文心X1发布仅半个月,百度称其是“首个自主运用工具的深度思考模型”;文心大模型4.5是百度自主研发的新一代原生多模态基础大模型,在多模态交互、理解方面更强,原生模型联合预训练能实现更深层次的模态融合。
得益于“自研+开源模型”的组合,用户拥有了选择权,切换到“自动模式”,就可一键调用最优模型组合,或根据需求灵活选择单一模型完成特定任务,大幅提升响应速度与任务处理能力。
这也让文小言拥有了更强的“大脑”。以装修方案为例,输出prompt:我的客厅朝向是南偏东,35平米,有一整扇落地窗,请根据我的要求画出浅色奶油风、暗黑轻奢风、跳脱童趣风这三种不同风格的装修效果图,三个户型必须一致。
我选择文心X1模式,文小言就能根据需求点,生成多种装修风格的方案,设计原理、效果图一应俱全。它在推理过程中,图文并茂、自如调用工具的能力让很多人都眼前一亮。
根据百度此前介绍,文心X1利用递进式强化学习训练方法、基于思维链和行动链的端到端训练、多元统一的奖励系统等技术。也可以理解为,这是百度自研大模型的独门绝招,文心X1的推理输出是直接可以图文混合连续完成任务。
多模态理解能力上,文小言再度增强图片理解能力。比如短视频平台上有一类比较热门的挑战:根据图片猜测街景或者所在位置。发起者所上传的图片,标志性、辨识度以及信息量都不是很高。文小言能够很快并准确的分析出答案。
还有“中午吃什么”的世界难题,只要你拍下菜单,告诉它类似的需求:两个人有两百块人民币预算,想要吃得丰富些,应该怎么点餐?文小言在极短的时间内,就能给出一个满意的解决方案。
文小言还进一步提升了全新语音大模型、图片问答、AI 生图生视频等能力。比如,全新语音大模型支持方言对话、复杂知识问答及随时打断等场景,用户可进行语音知识问答或趣味角色扮演。
以小朋友和小言的对话为例,衔接丝滑,不用担心打断后,AI接不上话。还能切换蜡笔小新、孙悟空、熊大熊二等百变音色。不仅如此,其还学会了多种方言。重庆话、河南话、广西话等等都能聊。
图片问答功能让用户可以通过拍摄或上传图片,以文字或语音提问直接获取深度解析。例如,拍摄一道数学题可实时生成解题思路与视频解析;上传多款商品图可对比参数、价格,辅助购物决策;拍摄杯子设计图后,AI 可自动解析风格并生成同款手机壳、支架等周边产品。
值得一提的是,新增的“图个冷知识”功能更富趣味性,用户可预设“历史学者”“科技达人”等人设视角,为同一图片赋予多维解读。例如,当用户询问“猫窗探秘,为何猫爱窗边的科学真相?",文小言能从狩猎本能、能量获取、领地意识等角度给出独特解读。
百度找到做AI to C节奏
回溯来看,这应该是文小言两年来的第二次大规模升级。
2023年3月16日,百度只比OpenAI晚了不到四个月,就推出类ChatGPT生成式AI产品“文心一言”,拉近中国科技公司与海外AI大模型企业的差距。
2024年9月4日,百度把养了一年半的文心一言App升级为“文小言”,其定位也明确为“百度旗下新搜索智能助手”。当时,文小言推出富媒体搜索、多模态输入、文本与图片创作、高拟真数字人等“新搜索”能力;同时,独家首发记忆和自由订阅等新功能。
这次产品升级和定位折射出百度的野心:延续其在传统搜索上的优势,再次定义新搜索。官方认为,区别于其他搜索产品,AI时代的新搜索需要具备AI能力,包括生成式AI、多轮交互、个性化互动、智能体等多元功能。
也就是说,一款合格的“新搜索智能助手”,除了具备传统的信息检索能力,还应该满足用户在搜、创 、聊等多层次的需求,具备更像人、更懂人的特点。
文小言是百度在AI to C上迈出的关键一步,其在搜、创、聊等多个维度实现了对搜索行业的变革。并且,单从名字上看,它的拟人属性就摆在显要位置,在传播上大幅弱化过往百度产品浓重的“工具属性”,与普通用户更有“路人缘”。
我还注意到一个业务动向,文小言完成升级后不久的10月,百度召开了2024年第三季度总监会。第三季度通常是百度的战略季,李彦宏和百度总监级以上管理人员都会参加,可见其重要性。
李彦宏在会上作了近万字的发言,为百度未来一段时期的业务战略定调以及作思想动员。其中,他提到,“文小言”没有必要像豆包、Kimi一样激进推广。后续半年,文小言一直“低调发育”,直到此次再度焕新。但其用户规模、产品体验友好度,一直居于同类产品相关榜单的前列。
还有比较重要的一点是,基于对搜索的全新认知,李彦宏认为,搜索的重构和重建应该分成两步:
首先是搜推融合。他强调,搜索做任何的改变,不仅要看对搜索场景下核心业务指标的影响,也要看对Feed这个核心业务指标的影响。空框推荐(比如百度搜索框中会预置一些词和句子)的本质是一种推荐,因为这个词不是由用户来Input的,只有用推荐的理念来做才是正解。
其次,AI要和移动生态结合。AI需要跟移动生态做进一步融合,比如图像用户界面和自然语言界面怎么结合会更自然,这会是未来搜索发展的一个范式。
我一直认为,AI to C需要解决两个关键问题:用户体验和商业模式。因为只有在这两方面取得突破,基于不断优化使用体验的前提,让AI解决真实场景的用户需求,AI to C才能被用户接受并忠实的留存,进而产生商业价值。
文小言的两次升级,都没有偏离李彦宏设定的两步走策略,也符合这个逻辑。它在不断融合百度移动生态,比如集成诸多智能体,为用户提供服务。同时,百度也鼓励用户创建自己的智能体,并进行分享。为此,百度还设立社区模块,打造交流平台,交流创作经验。
不仅如此,文小言也在融合百度体系内外的技术能力。在此基础上,文小言满足了百度对新搜索的定义。百度也在这个过程中,找到做AI to C产品的节奏:生态层开放,场景层深耕,价值层进行重构。
百度相关负责人在活动现场对唐辰表示,过去 AI App 是模型的展示场,但这对于普通人是不够的。模型就像引擎,但普通用户要的是车,就还得加上车架和座椅,才能满足舒适的驾乘体验。
在体验和交流过程中,我明显感觉到,百度想“开”了之后,其AI To C的产品气质和节奏,正在发生肉眼可见的变化,有一种甩掉包袱的轻快。就像李彦宏在百度产品接入DeepSeek后表示,“百度希望和大家一起,推动人工智能技术进步,让所有人都能使用最先进的生产力工具,让所有人都能从中受益。”
这或许也是百度持续升级文小言的意义。
但不可避免的,百度AI to C产品还存在着一些惯性问题。比如在功能设计上,百度十分慷慨,希望把自己所有的好技术成果都呈现在用户面前。但面面俱到也并见得是好事,无形中拉高了用户的使用门槛。我在使用搜题功能中,按照提示寻找上传问题的入口,花了很长时间。结果在对话框上方,“解题老师”的快捷入口已经被单独列出来了。
对百度来说,节奏对了,剩下的调试,就是在与时间赛跑,与友商赛跑了。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.