对大企业来说,保守不单单是因循守旧,更多时候,则是无法与昨日成功的自己,奋力作别。
可面对未来,百度还在持续张开怀抱。
2月28日,百度官方公众号宣布,将于3月16日发布文心大模型4.5,继续自身开放的战略转轨,并且,一些更加明朗且积极的信号,也在该事件中悄然传出。
按照百度的说法,即将全面开放的文心大模型4.5,将是百度最强的下一代大模型。尤其在基础模型能力上,文心大模型4.5将迎来大幅提升,且具备原生多模态、深度思考等能力。
到了今年的6月30日,该模型还将正式开源,这或将带给用户更好的体验,以及对GPT-4.5发起全面挑战。
不仅如此,算上此次文心大模型4.5推出,以及DeepSeek横空出世后,百度接连宣布文心一言免费和上线深度搜索功能,加上旗下搜索、地图、小度等相继接入了 DeepSeek,可以说,百度近期打出了系列“开放”的组合拳,无疑正以一种开放的姿态,直面行业的剧烈变化。
而这一切,看似是战略的转变,实则,更是一种技术积淀的必然回响。
百度让Open Ai脸红心跳?
在DeepSeek掀起行业开放浪潮之时,百度,无疑是国内响应最为迅捷的企业之一。
这一次,即将在3月16日发布的文心大模型4.5,或也将为行业聚光灯下,对百度“大模型”的期中大考。
不过,据百度方面透露,文心大模型4.5在基础模型能力上已经有了大幅提升,且具备原生多模态、深度思考等能力,号称百度最强大模型。
具体而言,此次文心大模型4.5,具有当前行业内几乎最强的RAG(检索增强生成)能力,而该能力,也是衡量大模型优劣的重要标准之一。
为此,百度的RAG,可在大模型理解用户需求阶段,不断对知识点进行拆解,细化问题。到了检索阶段,又可向大模型展开搜索排序优化,并将搜索返回的异构信息统一表示,送给大模型。
到了最终的生成阶段,百度RAG还可综合不同来源的信息独自判断,尤其加上百度实时和全面的搜索生态后,基于大模型逻辑推理能力,就可一举解决信息冲突等问题,从而生成准确率高、时效性好的答案。
事实上,自文心一言发布初,百度便一直强调检索增强,随后经过近两年技术沉淀,百度的检索增强能力不断提升的同时,也让该能力的价值,受到业界一致认可。
并且,百度即将推出的文心大模型4.5,更在百度自研的iRAG等技术加持下,可将百度搜索的亿级图片资源与自身强大的基础模型能力相结合,从而生成种类繁多的真实图片。甚至,iRAG可以做到在生成特定物品、特定人物以及特定人物与任意背景结合的图像时,在准确率、真实性上都有显著突破,极大减少幻觉。
其呈现的整体效果,将会远远超过文生图原生系统,不仅能够去掉了Ai味儿,而且成本很低,在使用场景上,不论是影视作品、漫画作品,还是连续画本、海报制作等领域,无疑带给用户留有大量施展才华的空间。
一个可以预见的例子是,在文心大模型4.5正式上线后,用户如果有品牌宣传的需求,则可以借助iRAG技术下,在几乎0成本操作中,像素极复刻以往大片宣传海报动辄需要一二十万,甚至大几十万成本的图片。此外,文心一言还将上线的深度搜索功能,可为用户提供专家级内容回复,实现多模态输入与输出。不仅如此,深度搜索功能下,还能提供多项工具调用,包含了高级联网、文档问答、图片理解等功能,在用户处理多场景任务中,效能无疑将得到极大提升。值得注意的是,先前的2月27日,百度准备发布文心大模型4.5消息一经公布,2月28日的凌晨,OpenAi则迅速发布了GPT-4.5模型。似乎,双方正在暗自较劲。
不过,OpenAi的发布或许略显仓促。据报道,OpenAi前员工安德烈·卡帕西,曾提前体验了GPT-4.5后,认为GPT-4.5主要提升在非推理密集型任务上的改进,这些任务多与情商有关,而在数学、代码等领域,GPT-4.5并不拥有最强的能力。
当然,GPT-4.5与文心大模型4.5双方具体表现如何,仍有待进一步验证。
不过,从先前文心一言和ChatGPT对比来看,文心一言在中文语境与本土化上,往往有着GPT难以比拟的优势:尤其在问答准确性、实时性上,文心一言的幻觉较少,对时事的反应也更加迅捷。
从这点上说,百度的文心大模型4.5的深度思考能力,加上自身极强的多模态功能,对中国用户而言,或许在未来能有更好的体验。
例如,从RAG能力实测来看,在国内外主流大模型中,百度文心一言综合表现一直属于第一梯队。即使是春节档电影细节、春晚节目等内容,文心一言都可以准确回答,做到文能对题,相比之下,OpenAi虽能检索到信源,却无法生成准确回答。
更重要的是,文心一言将于4月1日全面免费,PC端和App端用户均可体验。与之相对的是,GPT-4.5虽接入API,但OpenAi计划逐步转向GPT-5的免费基础版(额度受限),付费用户需升级至Plus/Pro版本。
从这点上说,免费且开源的文心大模型4.5,起码在普惠性上,将带给用户更多的诚意。
开放,不仅仅是一种姿态
DeepSeek横空出世后,浪潮风波席卷全球。
对此,百度却没有故步自封,反而动作频频,持续以一种开放的姿态,直面变化。
此前的2月13日,文心一言就正式宣布,将于4月1日起全面免费,所有PC端和App端用户均可体验文心系列最新模型,以及超长文档处理、专业检索增强、高级Ai绘画等功能,一举引起社会广泛讨论。
一天后的2月14日,百度接着宣布,将在未来几个月陆续推出文心大模型4.5系列,以及在6月30日起正式开源。
两天的2月16日,百度的开放,也延续到了对DeepSeek态度上:彼时,百度将全面接入DeepSeek和文心大模型最新的深度搜索功能。并且,搜索用户可免费使用DeepSeek和文心大模型深度搜索功能。
在百度全面转向开源、开放的战略转轨下,百度旗下的搜索、地图、小度等也相继接入 DeepSeek,由此,Ai浪潮引发产品升级的红利,也不断分享到了更多百度系的用户。
从大模型到搜索,百度的开源、免费,共同打出了一套开放“组合拳”。
从这点上说,在李彦宏带领下的百度,无疑正展开了一场自我变革,此时,决心和勇气缺一不可。
更重要的是,在这场开放过程中,又将会带给用户、公司、乃至整个行业哪些真正的价值?
对此,先前李彦宏曾谈到,开源4.5系列的决策,源自于对技术领先地位的坚定信心,开源将进一步促进文心大模型的广泛应用,并在更多场景中扩大其影响力:“我想强调的是,无论开源闭源,基础模型只有在大规模解决现实问题时,才具备真实价值。”
可以说,大模型烈火烹油的两周后,以OpenAi、百度等为首的头部玩家,已将这场大模型的竞争,步步进逼,终于向应用层面全面进击。此时,百度也在用一种更加开放的策略,试图去占据大模型第二场的主动权。
而在这场竞争中,更多应用层面的创新,无疑将惠及全球范围内,越来越多的用户。
“技术”如何打败“故事”?
“过去,我们谈论摩尔定律时,每18个月,性能水平或价格都会减半。但是今天,当我们谈论大语言模型时,增加的成本基本上降低了,可以在12个月内降低90%以上”
百度CEO李彦宏在世界政府峰会上,曾如此说道。
事实上,能够在DeepSeek冲击中迅速调整船头,而不一味固守“闭源”,这既是百度战略转折的勇气,也离不开百度长年以来技术沉淀的支撑。
李彦宏曾谈到:“不仅在Ai领域或IT行业,回顾过去几百年的历史,大多数创新都与降低成本有关。如果成本降低一定比例,生产力也随之提高同样比例,这就是创新的本质。在今天,创新速度比以往都快得多。”
事实上,Ai行业发展至今,“技术实力”正在取代“故事性”,逐渐成为该行业的核心竞争力。
从这点上说,当下,能够撑起百度文心大模型强功能、快更迭、免费开源的根本,则源于百度在技术上的底气。其中,百度在大模型上训练成本的持续降低,也离不开百度昆仑芯和百舸平台的助力。
近期,百度智能云成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。据悉,百度智能云将进一步点亮三万卡集群。
值得注意的是, 昆仑芯万卡集群具有极强的规模效应,大规模集群可以通过任务并行调度、弹性算力管理等方式,提高计算资源利用率,避免算力闲置,提高单任务的计算效率,降低整体算力成本,最终实心可大幅提高资源利用率。
这也意味着,在昆仑芯万卡集群规模效应的作用下,百度大模型的推理和训练所需的计算量一直在持续减少,从而直接降低算力成本。
不仅如此,百度的百舸平台,还能对大规模集群进行高效的部署管理。
例如,为解决大模型训练时高通信带宽的需求,百度不仅建设了超大规模HPN高性能网络,还可通过优化的拥塞控制算法、集合通信算法策略,提升了通信效率,将带宽有效性提升到90%以上。
同时,由于万卡集群的能耗极高,常规的散热方案能耗可达十兆瓦或更高,这将提升企业进行模型训练的电力成本,为此,百舸还采用了创新性散热方案,可以有效降低能耗,进一步降低模型训练成本。
此外,为提升GPU 的有效利用率(通常用MFU来表示GPU的有效利用率),百舸还在持续优化并完善模型的分布式训练策略,通过高效并行化任务切分策略,将训练主流开源模型的集群MFU提升至58%。
以及,为了保证大规模集群执行训练任务的稳定性,百舸提供全面的故障诊断手段,可快速自动侦测到导致训练任务异常的节点故障。加上百度自研的BCCL,目前已经将故障恢复时间从小时级降低到分钟级,保障集群有效训练率达到98%。
于是,当以上技术形成源源不断的合力后,到了24年初的财报电话会上,李彦宏则表示,文心大模型的推理成本,已经已降低至一年前的1%。
此次文心大模型4.5能够迅速推出,最大的原因之一,或许源于推理成本不断降低。
对此,有观点指出,百度在模型推理部署上的优势,尤其是在飞桨深度学习框架的支持下,其中并行推理、量化推理等都是飞桨在大模型推理上的自研技术。受此影响,飞桨和文心的联合优化,则可以实现推理性能提升,推理成本降低。
而面对机遇与风险并存的未来,人们可以预见的是,文心大模型4.5的推出以及近期百度频频开放的动作,远远不是终点——
“我们仍需对芯片、数据中心和云基础设施进行持续投入,来训练更好、更智能的下一代模型。”李彦宏曾谈到。
(转自:银杏科技)
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.