百度,来势汹汹

虎嗅APP
26 Apr

出品 | 虎嗅科技组

作者 | 房晓楠

编辑 | 苗正卿

头图 | 视觉中国

4月25日,在Create2025百度AI开发者大会上,百度发布了文心大模型4.5 Turbo和深度思考模型X1 Turbo两款新模型。较之文心4.5,文心4.5 Turbo速度更快,价格下降80%。

其实此次距离文心4.5和文心X1的发布才刚刚过去一个多月,模型短期内多次迭代,与之相对应的“应用”价值是否会被覆盖?创始人李彦宏的看法是,找对场景、选对基础模型、会调模型,做出来的应用就不会过时。

李彦宏演讲中多次提到应用,甚至断言,“模型有很多,但统治这个世界的是应用。”

此次,百度也发布了多款AI应用产品,包括一款官方定位为通用超级智能体的心响App。

据研发团队透露,这款产品是一支95后年轻团队在30天左右交付的结果,而正式开发是在3月18日。从时间推断,这个时间距离Manus亮相过去12天。

智能体来势汹汹。如果说去年关于大模型的落地应用还是处于悬而未决的试探阶段,那3月初Manus的爆火,直接给出了一个明确而具体的答案,应用是未来,AI智能体的喧闹前奏已经响起。

不管是对于大厂,还是初创企业来说,DeepSeek式的冲击与带来的措手不及,一次就好。这次,必须快速响应。像是字节,据媒体报道,在Manus出现前后,内部大概有7个团队在开发不同的智能体产品。

如今,初创企业中Genpark发布了Super Agent,大厂中的字节和百度相继推出新品,其他玩家也在蓄势待发。这一年,注定是AI智能体喧哗热闹的一年。

在心响App正式发布前,虎嗅等媒体事先进行了产品体验,同时也与百度智能体业务首席架构师、心响App负责人黄际洲,心响App产品经理黎宇昕进行了交流,他们结合心响App的研发,分享了当下AI 智能体行业发展的新思考。以下为交流实录,部分内容略有删减:

提问:短期组建的团队要在一个月内做出这一产品,为什么这么着急?是老板给定的deadline,为的是抢占行业时机节点?

黄际洲:我们没有非要赶某个时间节点,老板也没有给我们下目标(笑),我们就是想发一个现货。

AI智能体的摩尔定律是,每隔7个月AI智能体能完成的最长任务时长会翻番,设想一下如果按部研发、迭代,那等到呈现给大家用时,已经过时了。所以每一个节点,我们会逼着自己做一个(产品)发布。

提问:目前心响只有App,将来会出PC端吗?

黄际洲:会的。PC端在计划中,包括大家可能想要的上传文件、输入Excel表格输出图表、做分析、与Word联动等功能,都会有的。

提问:据了解,Manus这一智能体产品也在海外上线了App端,你认为PC端与App端智能体的不同点在哪?

黄际洲:首先,第一个不同也是最大的难点是,不是技术上实现不了,而是手机屏幕实在太小了,如果想让用户看清楚某个东西,或者进行快速交互时,不是件容易的事情。反之,PC端的屏幕大,但大也会带来问题,就是如何高效利用起来,高效交互。

第二是,在PC端可以非常方便地去打开各种生产力工具,比如Excel和Word,但在移动端想传一个文件难度很大,快速填表、填数据等在PC端很容易实现的事情,在移动端不容易实现。

黎宇昕:当然,两者技术上有更多的相通性,我们可以用多智能体协同的Pipeline去实现这个功能。PC端更多倾向于办公场景,比如PPT,我们确实有生成PPT的功能,但是在手机播放PPT也太鸡肋了,但在PC端就会相对轻松,文案一键编辑、自动改编、填表、写文档等都可以。

提问:当前的通用智能体或者超级应用,都是多智能体协同操作,过程中的技术难点在哪?

黄际洲:首先,最大的问题在于很多时候想去接入很多东西,而MCP协议的出现解决了这一问题,让大家能更快地接入。但到目前为止业界比较大的问题在于,大家都想获得但很少去做贡献,免费好用的工具实在太少了。可以算一个数字,把Tool Use做成MCP给到别人,乘以1000是很小的成本,但如果乘以10万、100万、1000万、1亿,那很难扛得住这个成本,所以我们想要构建广泛的生态,呼吁更多的开发者一同来做,这是一个所有人都受益的事情。

第二个问题是,要实现多模态工具间的使用,比如Agent Use,必须要有很强的协议。举个例子,平时工作中做(产品)开发会有PM、PE、FE各种各样的研发,承担不同的角色,彼此知识背景、专业术语不一样,说的话很难互相理解,频率不同接收的信息就有折损。智能体也一样,各个子智能体之间的互动和信息传递要尽可能做到无损,所以需要设计很好的协议和交互方式,能够把它协同起来。

第三个问题是大模型产品的“不可能三角”(虎嗅注:“不可能三角”国际经济学的一个著名理论,简单来说是指如果一件事情同时存在三个要素,三者不可都得),以搜索为例,大家已经养成的搜索习惯是输入一个词很快就返回答案,这是我们对搜索的心智。而对任务心智来讲,你要的是一个精准替你完成任务的管家,智能体产品能帮你完成任务、交付很好的结果。但在当下的技术发展趋势下,很难让它短时间内给到你最终任务结果,所以要做出(时间)牺牲。

提问:目前心响上各个场景中的智能体,都是百度自己开发的,还是外部接入?

黄际洲:我们很难把智能体开发得超过很多专业玩家。比如AI绘本,是接的百度文库的AI绘本功能,为了做到免费,我们向百度文库争取到了最大权益。健康也是如此,引入的是第三方。未来,我们想要构建开放生态,只要是市面上好的体验、做得比我们好、愿意被我们接入或者愿意接入我们,都可以接进来。

提问:当前越来越多的大厂开始接受MCP,未来智能体可能会变成红海赛道,竞争激烈。像是前段时间支付宝的百宝箱开了支付MCP Server协议。那百度在智能体竞争中,想怎么做?

黄际洲:MCP是个通用协议,只要大家遵循这个协议,开发者就不需要为A、B、C、D各开发一份,省时省力。而对于接入方来讲,遵循这一协议以后,可以很方便地接入,不需要再充分对接。

对我们来讲,现在是这样,如果某一东西(功能)是我们内部开发的,那有比MCP更高效的协议,从而保证更快接入(心响)。我们既支持自己独有的协议,也会把MCP接进来,这是一个原则。

当前实践告诉我们,优质的MCP是稀缺的,因为算力很贵。我做这么好的服务,不可能免费接入,我要构建起商业模式。但用户想白嫖,我们也想白嫖,开发者就被白嫖死了,无法养家糊口。所以未来是有一个供需之间的GAP存在,而最终生态的繁荣一定是能把商业模式跑通的繁荣。开发者能挣到钱,我们能挣到钱,需求越做越大,给大家提供越来越好的体验。当前,我们只专注于给用户提供极致的通用超级智能体产品体验。

提问:现在大家都在说超级智能体或超级应用,你认为最终的交互方式该是怎样的?

黄际洲:对于这一问题,我们也一直在思考。

关于交互方式,如果把用户千奇百怪的输入和不同的交互方式(语音、文字等)整合在一个产品里,这对于交互的要求超高,在完成不同任务时,也很难。所以我们一直强调一个很简单的输入,目标就是消灭复杂的prompt,但这很难一下子做到,所以我们尝试从极简化用户需要输入的东西开始,比如做城市攻略,用户输入“哈尔滨旅游攻略”就足够了,剩下的事情智能体会一步步帮你细化和完善,最后给出一个成品。

如对本稿件有异议或投诉,请联系tougao@huxiu.com

End

想涨知识 关注虎嗅视频号!

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10