随着国产AI大模型DeepSeek的持续火爆,DeepSeek官方服务器一直是超负荷,已经无法满足庞大的用户需求。特别是对于数据隐私安全及有着二次训练需求企业级用户,已经开始纷纷在本地部署满血版DeepSeek大模型。这也直接带动了市场对于AI一体机的需求。这其中,相比英伟达GPU更具性价比的国产AI芯片方案受到了市场的青睐。
国产AI一体机市场百花齐放
据不完全统计,到2025年2月,至少有20家国产芯片厂商宣布与DeepSeek展开合作,其中就包括了华为升腾、百度昆仑芯、海光、沐曦集成电路、摩尔线程等知名AI芯片厂商。通过国产AI模型+国产AI芯片的组合,国内AI生态开始打破英伟达的CUDA生态限制,推动“国产算力+国产大模型”生态系统的建设。
华为推出的升腾DeepSeek一体机,采用了升腾高性能算力底座,深度融合了DeepSeek全系列大模型能力,能够满足语言理解、图像分析、知识推理等全场景应用需求。
中国电信推出的“息壤智算一体机”基于华为升腾910B芯片,提供了全栈国产化推理服务,支持DeepSeek-R1/V3系列模型,支持全栈国产化推理服务,满足大型企业和政府机构对高稳定性和高并发性能的需求。
中国移动也发布了以国产CPU/GPU为核心的“智算一体机-DeepSeek版”,为企业提供“开箱即用”的私有化部署体验,适合快速部署AI应用。
拓维信息推出的兆瀚AI服务器也是基于升腾芯片,主要针对政务与教育领域的高并发需求,支持DeepSeek-R1/V3全系列模型,并提供快速部署的能力。
浪潮信息则推出了基于国产GPU(如沐曦芯片)的“海若一体机”,该一体机支持DeepSeek 671B大模型的单机推理,适用于复杂决策场景;而京东云则推出了支持多种国产AI加速芯片的DeepSeek一体机,帮助企业部署更高效的AI解决方案。
百度智能云也推出了搭载昆仑芯P800的“百舸DeepSeek一体机”,具备显著的成本优势。据介绍,百度的“百舸DeepSeek一体机”支持高性能的训练与推理需求,单机高吞吐,能够满足500人团队并发使用,响应速度极快,且运维成本低。
国产沐曦GPU的特定行业总代理商超讯通信,依托沐曦GPU良好的兼容性和适配能力,近期也推出“元醒”训练推理一体机,为客户提供本地化部署全栈式DeepSeek-R1/V3解决方案。
基于沐曦GPU,超讯通信拿下14.88亿元大单
2月24日,超讯通信发布公告称,公司与深圳市星航智算科技有限公司签订《智算集成服务采购合同》,合同含税总金额约为人民币6.38亿元。采购清单包含元醒曦云C500- P PCle训推一体服务器、交换机、光纤、光模块、网线及其他、智算云平台、大模型智能体平台、大模型数据知识平台及AI应用平台。
公告称,本合同的签订及正常履行将有利于实现公司所代理的“沐曦”GPU产品和自有“元醒”品牌算力服务器的批量销售,为公司算力业务拓展带来更多的市场机会。相关销售收入的确认将随着本合同的逐步履行而分阶段进行,若本合同能全部顺利履行,将对公司未来业绩产生积极影响。
在此前的2月7日,超讯通信还曾发布公告称,公司与中特新联科技产业发展(北京)有限公司签订《采购合同》及对应《采购订单》,客户向公司采购智算集成服务,合同含税总金额约为人民币8.5亿元。合同标的主要为元醒曦云C500-P PCie训推一体服务器、交换机、光纤、光模块、网线及其他、智算云平台、大模型智能体平台、大模型数据知识平台及AI应用平台。
需要指出的是,由于DeepSeek模型大幅降低了对于算力的需求,再加上模型的开源,打破了英伟达CUDA生态束缚,使得相比英伟达GPU更具性价比的国产AI芯片方案受到了AI训推一体机市场的青睐。
一个月内,超讯通信接连拿下了合计14.88亿元的基于沐曦曦云C500芯片方案的训推一体服务器大单,足见目前该市场对于沐曦AI芯片方案的认可。
资料显示,沐曦成立于2020年的,其创始人陈维良曾任AMD全球GPGPU设计总负责人;联合创始人、CTO兼首席硬件架构师彭莉是AMD全球首位华人女科学家(Fellow), 曾任AMD首席架构师,拥有15年高性能GPU设计经验;联合创始人兼软件CTO杨建博士是AMD大中华地区第一位科学家(Fellow),历任AMD、海思等首席架构师,拥有20年大规模芯片及GPU软硬件设计经验。
目前沐曦拥有用于AI推理的MXN系列GPU(曦思);面向AI训练、AI推理及通用计算的MXC系列(曦云)通用GPU(GPGPU)芯片;针对图形渲染加速的MXG系列(曦彩)GPU。
据相关报道显示,曦云C500在2023年6月就完成芯片功能测试,该芯片采用7nm制程, GPGPU架构,目标FP32算力达到15TFLOPS,大约达到了英伟达A100(FP32性能为19.5TFLOPS)的75%的算力。同样,曦云C500也支持多卡互联。
2023年8月,沐曦发布新闻稿称,曦云C500千亿参数AI大模型训练及通用计算GPU与北京智谱华章科技有限公司开源的中英双语对话语言模型ChatGLM2-6B完成适配。测试结果显示,曦云C500在智谱AI的升级版大模型上充分兼容、高效稳定运行。
今年2月初,在DeepSeek刚刚火爆网络之时,沐曦也联合中国开源大模型平台Gitee AI发布了全套DeepSeek-R1千问蒸馏模型,随后DeepSeek-R1、DeepSeek-V3 型均实现了在基于曦云GPU训推一体上成功运行。2月24日,沐曦还宣布其GPU率先跑通DeepSeek开源代码库FlashMLA。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.