AI已经太久没有一个“哇哦”时刻了。
自ChatGPT首次惊艳世人以来已经过了快两年时间,人们似乎已经开始习惯了AI作为一个什么都“略懂”的万金油选手出现在身边。可这样的时间久了,难免会让人觉得稀松平常。今年5月,AI头部品牌发布了旗下最新版本的大模型,然而收获的不是“哇哦”,而是“即便能像博士一样推理,也比不出9.11和9.9谁大谁小”这样的吐槽。
的确,目前的AI,能力在提高,但是效果有限;场景没突破,功能不再惊艳。这也是AI大模型应用遇到的普遍困境。这尴尬的氛围正在外溢:比如,手机上的AI功能,作为人们接触AI门槛最低、最频繁、依赖性最高的使用场景,也因为AI行业整体的延宕而缺乏“爆点”。
客观的说,手机AI好不好用?当然好用。不然也不会有众多手机AI产品出色的活跃度和用户体量。但是如果深究到底有多好用?相信资深AI用户们只要深思熟虑一番,或多或少都会有些“摸到了AI的边界”的感觉。
但这种感觉对于一个被寄予“颠覆未来”厚望的品类来说却是大忌。行业也亟待扭转这种温吞的状态。问题是,如何扭转?
10月10日,vivo开发者大会(VDC)召开,vivo发布了全新AI战略:蓝心智能。同步发布的新产品还包括全面升级的自研蓝心大模型矩阵、OriginOS 5、蓝河操作系统2等。与此同时,vivo还披露了其在安全、人文、生态合作等方面的一系列最新成果。从这里,我们看到vivo对于AI的现状和未来确有独到的理解和尝试。同时,在审视vivo诸多能力落地的过程中,也碰撞出一些对于AI发展的新鲜观察。
vivo副总裁、OS产品副总裁、vivo AI全球研究院院长周围
重新思考AI的位置
在今年初的MWC上有一种普遍的观点,那就是AI或许应该暂时被放在“副驾驶”的位置上。实际上,这种论调体现了当时人们对于AI既新奇又疏离的感受。智能硬件行业也是如此,即便2024年被称作“AI手机元年”,但在当时相对保守的氛围下,手机端的AI服务也大多以AI小助手、AI问答APP,甚至只是AI修图等形式呈现。
然而,这种仅仅把AI定义为“助手”的思维显然禁锢了AI在手机端发挥作用的潜力。如今,以vivo为代表的手机厂商开始重新审视AI的定位,尝试让AI发挥更大的主动性。
在vivo发布的“蓝心智能”全新AI战略下,vivo决定充分释放AI的能动性,将大模型技术与手机操作系统深度融合,利用 AI 赋能OS。
具体来说,vivo的实践将在重构人与设备的交互体验,重构人与数字世界的服务体验,重构人与物理世界的沟通体验这3个方向协同推进。
在人与设备的交互体验方面,vivo向AI释放了手机端所有层面的交互能力。从简单的打字、语音,向包括圈、点、滑、拨,甚至声音的情感等不同的方面延伸。比如,在使用“小V圈搜”进行搜索时,用户可以长按导航条激活小V,还可以直接将图片、文件、文字拖拽给小V。甚至可以不输入命令,直接随手用指尖圈选内容发给小V。这就避免了很多“问不到点子上”的尴尬时刻。毕竟把自己想问的问题翻译给AI也很费神。在vivo的设计下,无论怎样交互,小V都会将想要了解的内容反馈给用户。
小V圈搜
在人与数字世界的服务体验方面,vivo让AI与人的关系更近了。首先是将“垂直AI”的理念下放到手机端,除了助手小V以外,还通过“蓝心智能体广场”塑造了小V作业助手、小V运动教练等专家AI。这就从一定程度上解决了AI“泛泛而谈”的问题。此外,vivo让AI介入了人使用手机的痕迹,分析用户用手机的习惯,把用户喜欢的文章和视频等用更有逻辑的方式呈现出来。
在人与物理世界的沟通体验方面,vivo努力让AI更加显示出积极主动的一面。此前,vivo的蓝心大模型已经升级了语言大模型和端侧大模型的能力,并带来vivo自研的语音大模型、图像大模型以及多模态大模型,拥有了听和看的能力。在此基础上,vivo让AI能够读屏,能够通过摄像头“看懂”外部世界。比如,在vivo的“看见”APP蓝心升级版中,视障人士就可以把手机镜头对准周围环境和物品,让手机成为他们的眼睛。此时,APP会自动播报它“看见”的内容和文字信息,让他们能够独自安全地走到更远的地方。因为有大模型的加持,用户还可以与AI进行多轮语音对话,得到更多细节信息。
实际上,vivo提出了相当现实的愿景,却起到了根本逻辑上的改变。不用太多科幻的许诺,通过将前沿的AI大模型研究充分释放到手机端,vivo就能将AI从机械的你问我答的“副驾驶”身份中解放出来,适当地帮人类把握方向盘,甚至充当教练的角色。当人们体验了AI解禁后的洪荒之力,就像发现了老朋友的另一面,很难不“哇哦”一下。
正如vivo副总裁、OS产品副总裁周围所说,“手机不是一个神秘的东西,它就是我们生活、工作所依靠的东西。vivo就是想把它的基础体验做好,把基于产品的那些功能增强”。的确,手机本身已经成为人身体的延伸,手机中的AI没有道理不为人类承担得更多。
理念背后,AI能力落地的硬实力
可以看到,vivo的重构战略是将现有手机端AI能力整体向前推进了一大步。如何能够支撑这样的体系性进化?在VDC上,vivo公布了蓝心大模型矩阵和OriginOS 5,向世人集中秀了一波肌肉。
一方面,此次蓝心大模型矩阵的集中展示是最令人激动的环节:
vivo几乎在大模型的所有前沿应用领域都有所突破,一口气拿出了升级版语言大模型,以及发布3B端侧大模型、蓝心语音大模型、蓝心多模态大模型等全线产品,可谓火力全开。
其中,升级后的蓝心语言大模型在上下文能力、推理能力、准确度以及时延上,均有明显提升。新发布的vivo自研蓝心语音大模型可以准确理解自然语义,实现超低时延对话,还可以感知人的情绪、模拟人的音色,像朋友一般与用户聊天,甚至担当同声传译的角色。这次新发布的还有蓝心图像大模型和蓝心多模态大模型。蓝心图像大模型强化了中国特色与东方美学的融合生成能力,是国内最懂中文语境的图像模型之一。而蓝心多模态大模型则提升了识别能力,能够更深层次理解用户的屏幕内容,还拥有更自然的视频流实时对话能力。
而此次的重头戏其实还应该放在新发布的全新端侧大模型蓝心3B身上。这款端侧大模型有30亿参数,但是能力却可以越级比肩拥有70亿甚至90亿参数的同类产品。对比蓝心自己的7B大模型,端侧大模型3B的覆盖场景更多。相比蓝心7B极致性能提升300%,平衡模式下功耗优化达46%,极致出词速度可以达到80字/s,系统功耗仅450mA ,内存仅占用1.4GB,打破了“模型小、能力强、功耗低”的不可能三角定律,实现了以小搏大的效果。
据vivo介绍,蓝心大模型3B已经获得了泰尔实验室端侧大模型综合能力的5星认证以及AIIA安全防范能力5星认证。更令人激动的是,3B还只是一个开始。明年,vivo还将发布端侧视觉大模型和多模态大模型。
考虑到目前vivo蓝心大模型已经在上海人工智能实验室大模型测评榜单、微软的MathVista测试榜单,以及ChartQA测试榜单上都取得了3B参数级排名第一的成绩。在以文本理解为代表的OCRBench榜单上,蓝心多模态大模型13B取得了所有模型参数的最高分,超过了GPT4o、qwen等一众超大规模多模态大模型,我们有理由期待未来vivo将手机的智能化程度推向一个新的层次。
另一方面,承载蓝心大模型矩阵诸多能力的,恰是全新升级的OriginOS 5:
在塞下了前面如此之多的AI大模型能力之后,vivo确实需要一个能够完全释放AI能力的操作系统了。因此,OriginOS 5既是AI的容器,也是AI的出入口。沉浸式嵌入OriginOS 5中的“蓝心小V”拥有了十八般武艺。比如,交互更灵便的小V搜索,推荐内容更精确的小V建议,能够梳理用户喜好按照逻辑呈现的小V记忆。而此前提到的“专家”AI选手们,则通过小V智能体的形式在小V智能体广场里呈现。
同时,OriginOS 5也在流畅度、续航、通信方面针对AI能力的释放作出了相应的优化。实际上,AI的硬实力更需要操作系统的软实力来体现。操作系统优化的成熟与否,直接影响用户对AI的认可度。vivo推出OriginOS 5本身就是对AI与人类交互能力的一次长足探索。也正是对vivo立足“AI重构系统体验”的一次检验。
至此,vivo已经将AI推到了手机端服务C位的位置上。经过战略转变和能力落地,AI的效能得以全部释放,开始作为智力和精力的延伸,为人类赋能。
冷思考:多些务实,少些科幻
纵观vivo的全新AI战略,这其中的平实、务实令人感慨。
诚然,我们已经听过了太多关于AI的远大愿景和宏大叙事了。实际上,当我们将人们对AI的注意力引向科幻场景(比如终极人工智能、AI替代人类等等)时,其实是在消解大众探索AI帮助人类提高的努力。
在当前AI与人类都还在“教学相长”的阶段,我们更需要有人亦步亦趋地做好AI的普及。而这,何尝不是一种科技平权。
又或许,vivo内部“本分”的理念,让其更坚持用户导向,也让产品的功能能够回归本源。
对此,vivo副总裁、OS产品副总裁周围介绍到“我们的本分文化叫平常心文化”,他认为“vivo发展AI的思路和vivo的企业文化是完全一致的”。
周围认为,vivo是“回到本质去思考,本质的东西就是‘因’层面的东西,我们把这些东西做好,自然‘果’是水到渠成的”。言及至此,不得不提及一个小细节:此前我们评测手机AI应用的过程中发现,在二十余款AI应用中,能够在折叠屏手机展开横放的情况下自动变为横向显示的AI应用屈指可数。而蓝心小V不仅自动适配横向展开,而且还根据用户双手操作的特点进行了布局调整,可谓用心至深。
或许,凡此种种从用户需求出发的小细节叠加在一起,恰能体现vivo“本分”的初心。大概也是vivo能够从用户体验出发让AI重构系统体验的原动力。
无论如何,AI诞生的根本原因就是帮助人类,推动进步。而AI的下一个阶段也必然是渗透社会的方方面面,带来更大的变革。显然,此次VDC让我们看到,对于手机领域,vivo已经作出了根本性的决断,率先下出了先手棋。
特别策划
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.