商汤最新“日日新V6”突破多模态与低成本边界,徐立:AI之道在于百姓之日用

财经涂鸦
11 Apr

  炒股就看金麒麟分析师研报,权威,专业,及时,全面,助您挖掘潜力主题机会!

“SenseNova V6 Omni”成为国内首个商业化的全模态实时交互模型。

作者:苏打

编辑:tuya

出品:财经涂鸦(ID:caijingtuya)

公司情报专家《财经涂鸦》获悉,4月10日,商汤科技在其“2025技术交流日活动”中,宣布推出全新升级的“日日新SenseNova V6”(简称:日日新V6)大模型体系。

最新“日日新V6”通过多模态长思维链训练、全局记忆、强化学习的技术突破,形成领先的多模态推理能力,并突破成本边界。

AI之道,在于百姓之日用商汤科技董事长兼首席执行官徐立表示,商汤日日新V6”将跨越多模态边界,释放推理与智能的无限可能

据悉,该大模型体系的模型能力显著提升,在长思维链、推理、数理、全局记忆方面拥有显著优势,多模态推理能力国内第一,对标OpenAI o1,数据分析能力大幅领先GPT-4o;全新的轻量级全模态交互模型SenseNova V6 Omni带来了国内最强的多模态交互能力;涵盖国内首个支持10分钟中长视频深度解析的大模型,对标Gemini 2.5 Turbo达到同类型最强。

值得一提的是,“日日新V6”的多模态训练整体效率对齐语言训练实现业内最低、推理成本均实现业界最低,进一步实现高效能与低成本的结合

率先实现“多模态下”深度思考

从模型能力看,拥有超6000亿参数的“日日新V6”通过多模态长思维链、强化学习、全局记忆,率先实现多模态下深度思考凭借单一模型即可完成文本、多模态等各类任务。

“多模态是走向通用人工智能的必由之路,许多图灵奖得主也认同,纯粹的语言模型可能无法完整表达人类的智能。”徐立表示。

基于超过200B高质量多模态长思维链数据,商汤通过多智能体协作进行长思维链合成和验证,“日日新 V6”形成了突出的多模态推理能力,可以支持合成最长 64K 的多模态长思维链,支持模型长时间思考能力。

针对真实环境存在的复杂问题以及复杂繁琐的文档处理,其强混合图文理解推理能力和多模态强推理能力,能够帮助用户解决各类问题。例如,在保险理赔场景中,“日日新 V6”可根据商业医疗保险理赔材料,判断提供材料是符合理赔要求,检查是否存在乱开药、乱检查、材料缺失或者材料对不齐等问题。

小额理赔虽然金额小但往往耗费时间长(3-7天),而‘日日新 V6’能自己检测到风险提示,自己交叉验证,最后再给到用户非常细节、多维的结论,完成模型到客户使用的最后一公里。”徐立举例道。

得益于多模态强化学习的突破,商汤构建了面向多种图文任务的混合增强学习框架,基于不同难度分级和多奖励模型的强化学习训练。

据悉,“日日新 V6”在权威的推理能力及多模态能力评测中,于多个维度获得SOTA——核心指标方面,纯文本推理与多模态推理能力均均对标 GPT-4.5 和 Gemini 2.0 Pro 等国际一流模型的水平;强推理能力上,从 5.5 到 V6 / V6 Reasoner,推理能力显著提升。在独立评测中,多模态和语言深度推理任务上同时超过了 OpenAI 的 o1 和 Gemini 2.0 flash-thinking 的水平

SenseNova V6 Omni”发布即实现多行业落地

商汤日日新实时交互融合大模型也同步升级至“SenseNova V6 Omni”,在角色扮演、翻译点读、文旅导游、讲解绘本、数学讲解等场景下进行了深度优化。

以翻译点读场景为例,“SenseNova V6 Omni”让用户通过手指就能实现精准位置的空间交互,并精准理解局部信息与全局信息的关系,带来更符合人类自然直观的指读交互体验。

它拥有更像人的感知和表达能力、情感理解能力,并已在具身智能等领域实现多行业、多场景落地,成为国内首个商业化的全模态实时交互模型”。商汤表示。

与此同时,凭借“全局记忆”能力,“日日新 V6”已支持10分钟级视频全帧率解析,打破了传统模型仅支持短视频的限制,且可以对视频的精彩内容进行智能剪辑输出。

据悉,商汤自研技术可将视觉信息(画面)、听觉信息(语音、音效)、语言信息(字幕、口语)、时间轴逻辑进行对齐,形成多模态统一时序表征。在此基础上通过细粒度级联信息压缩和内容敏感的动态过滤,实现长视频的高比例压缩,10分钟视频可以压缩到 16K tokens,仍然保留关键语义。

此外,通过整合日日新SenseNova V6全部能力,商汤商量全面升级至全新“商量APP”。用户通过一个入口,即可体验文字、图像、视频等多种模态流式交互体验。目前,商量APP已启动内测,“日日新V6”的能力可在商量Web端体验。

海量资讯、精准解读,尽在新浪财经APP

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10