联想:AI服务器首次实现低于1TB本地部署DeepSeek满血大模型

新浪科技
03-04

  新浪科技讯 3月4日上午消息,近日,联想集团宣布基于联想问天WA7780 G3服务器,在行业内首次实现单机部署DeepSeek-R1/V3 671B大模型,以低于行业公认1TGB显存(实际768GB)承载多并发用户流畅体验,可以满足千人企业的使用需求,为行业树立了企业级大模型部署新基准。

  作为全球关注的焦点,众多企业正准备在本地化部署DeepSeek大模型。然而,在落地实施过程中用户普遍面临以下关键决策难题:单机能否部署满血版DeepSeek R1?所需最低配置是什么?如何确保高并发与吞吐量下的优质体验?如何避免采购陷阱?

  联想此次突破为企业提供科学选型指南。针对行业公认1TB显存是千亿参数大模型运行基线的背景下,联想研发团队通过专家并行优化、智能访存架构升级及PCIe 5.0全互联架构创新,大幅提升了显存利用率,从而实现了性能的提升。

  据了解,联想WA7780 G3服务器在2月初已实现单机768GB GPU显存条件下部署DeepSeek 671B R1和V3满血模型,并能满足中小企业的并发需求。进而通过联想万全异构智算平台的访存优化,专家并行调用策略等技术优化手段,实现了单机一个月内并发能力增长10倍, 同时还提升了每路用户的TPOT、TTFT等综合性能体验。(罗宁)

海量资讯、精准解读,尽在新浪财经APP

责任编辑:江钰涵

免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。

热议股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10