文|数智前线 任晓渔 游勇
智算热潮里的冷思考
2024年,虽然融资市场呈现冰火两重天,但全球人工智能和大模型市场始终保持着超强的吸金能力,产业链各个环节融资动态频出。
生成式AI继续发酵,2024年的智算市场称得上炙手可热。
中国通信工业协会数据中心委员会在刚刚过去的12月发布了《中国智算中心产业发展白皮书》,其中的数据显示,2024年11月,全国已投运的智算中心项目近150个,在建及规划建设的智算中心项目近400个。
数智前线此前也统计,仅2024年前7个月,包含土建基础设施和IT基础架构等方方面面在内,智算中心相关项目中标公告已发布超140个。
行业的火爆,甚至还能从从业者在各大论坛及产业交流群里的热火朝天交流身影中可见一斑。年初开始,许多计算及大模型相关产业群里,最活跃的人里肯定有智算从业者。
业界观察到,这股建设热潮呈现出了几大特征:
首先,市场需求的爆发速度,远超业界人士的想象。
IDC中国企业级研究部研究经理杨洋就表示,他们在2023年下半年预测时已经对智算服务市场增长充分乐观,但从2024年的实际情况看,他们此前的预估依然偏保守,整个智算服务市场在以远超预期的增速在成长。
预期以外的高增速,既使得智算中心的项目建设数量在大幅增加,智算中心的建设规模也在不断膨胀。
根据数智前线此前对各类公开招投标数据的不完全统计,仅从去年前几个月数据看,智算中心的招投标项目数量逐月递增。而招投标数据还显示,许多项目的中标金额超过了1亿元,去年6月最大的项目,平潭两岸融合智算中心项目(一期),中标金额达到了4.06亿元。
其次,建设和需求主体越来越多样。不同于国外的智算基础设施以公有云部署为主的模式,在国内,云计算厂商构建的AI云,地方政府、运营商以及一些金融行业企业共同推动了当下的智算基础设施建设热潮。
地方政府投入多为推动产业发展考量,IDC数据显示,截至去年6月,过去几年里政府参与建设并已投产上线的智算中心数量已接近百个。
而运营商的角色也凸显出来。数智前线此前统计,去年前7个月的智算相关招投标项目,运营商主导的比例超四成。
从需求方看,对智算需求的行业也非常多元。大模型创业企业的需求自不必提,车企、手机厂商和高校的智算需求也在步步走高。
车企在智算市场,不算新玩家。几年前开始它们的采购规模就仅次于互联网企业。生成式AI到来后,大模型上车成为行业热点。一位车企行业人士判断,未来1~2年车企智算需求将会翻两番。
高校的智算需求也因为AI For Science热潮一路走高。许多高校在智算领域的投入力度不小,一些项目的建设规模甚至在数亿元水平。医疗行业里,更高效的算力基础设施可以加速医疗影像数据处理与分析的速度,提升诊断水平和服务质量,一些大型医疗机构和研究院校也有了不小的智算需求。
不过,这股建设热潮里,业界也不乏资深人士发出一些偏理性的声音。
比如有人提到,算力焦虑在当前智算中心建设热潮下,好像依然没有解决。
中国计算机学会(CCF)副理事长陈健去年9月也在中国高性能计算学术年会上指出,一味增加硬件资源而不考虑效能,是对资源和财力的浪费。他表示,行业内需要考量如何更有效地开发和利用现有资源。
还有声音认为,上一波算力基础设施建设热潮中就曾出现过利用率低问题,当下的智算中心建设,不能只追求规模,重硬件轻软件、重建设轻运营的建设思路并不可取。
国家信息中心信息化和产业发展部主任单志广也曾提醒,要避免重建设、轻需求,应以应用为导向,提高整个算力中心的利用度。
复杂多元需求,呼唤“精装算力”
冷思考背后,本质是与当下大模型应用和落地呈现出了场景和业务多元、任务差异较大的特点密切相关。
比如大模型落地最积极的金融行业,需要的是低延时和高性能算力,来处理海量的金融交易数据,以及支持实时的业务决策;新能源汽车客户,由于智驾的旺盛需求,对边缘算力会有更高的需求;而对于很多ToC应用为主的客户,它们对模型推理的需求会显著高于训练的需求。
诸如此类,业务场景的不同、训推场景的差异,对算力的需求千差万别。以前只重视算力集群的规模,一昧迷信堆卡的做法越来越行不通。大模型赛道需要从全局智算角度,统筹算力的供给。
不久前的乌镇互联网大会上,宁畅针对上述用户痛点,提出了非常形象的“精装算力”概念,引发了行业内的广泛关注。
好比精装修的房子一样,依托宁畅的定制化与全栈全液能力,以算力栈为交付形态,从用户需求与体验出发,提供全体系软硬协同的精细化算力服务,最终给用户提供拎包入住的算力服务体验。
精装算力得以实现有两大前提:一是定制化,二是全栈全液。
定制化在“硬装”层面可体现为给用户提供了多种交付形态的灵活组合。比如可以提供覆盖云、边、端等多种业务场景的服务器,不仅支持高密、通用、AI等多种服务器形态,也支持全闪、混闪等多种存储组合。比如宁畅AI工作站-塔式服务器W350 G50可部署在办公环境或搬运至外景地,被广泛应用于影视渲染、汽车智造、工业仿真等领域。
而且,宁畅还可以根据散热模块提供液冷、风冷、风液混合等部署方案,确保根据不同场景和需求调整最优的散热方式,不仅极大提升了算力效率,也尽可能的降低了成本。
但算力的发挥光靠硬件支撑是不够的,还需要软件层的优化,也就是精装算力的“软装修”。宁畅的算力软装修可以从基础算子优化、系统功能优化、运营支撑优化、模型性能优化到平台级AI管理的全局优化,涵盖“算存网管用”算力运行的完整体系。
比如在平台级AI管理方面,宁畅全面支持NVIDIA AI Enterprise(NVAIE)平台,加速数据科学工作流并简化生成式AI的开发和部署,再搭配宁畅自有的AI Manager管理平台,提供集计算、运营、运维于一体的平台级AI管理服务。
另外,宁畅也是业内少数能提供“全栈全液”AI基础设施方案的厂商,涵盖了从底层硬件到顶层应用平台的全栈系统环境支持,并提供全液冷产品方案,在宁畅全栈液冷模块化解决方案支持下,智算中心的PUE值最低可达到1.08,针对超大型算力中心,宁畅的浸没式液冷全栈解决方案最低可将PUE降至1.05,助力实现高效与绿色并行。
这意味着,在这套软硬件全栈+定制化的精装算力加持下,宁畅可以根据不同行业的特点,比如互联网、汽车、制造等提供有针对性的解决方案,让不同行业的客户在AI时代能获得交付省心、运维省钱、部署省力、推训省时的优质体验。
如今,在大模型加速落地的大背景下,企业对算力的效率和成本有着更加严苛的要求,宁畅的算力精装房,极大限度地给企业带来了“拎包入住”的便利。
而这套全体系软硬协同的算力服务也正在被越来越多企业所采纳。宁畅在浙江桐乡搭建的首个精装算力样板间——宁畅算力栈已吸引了超千家客户申请试用,越来越多的大模型在宁畅的支持下顺利落地。
全栈式服务,助力AI更快落地
中国信通院在《智算基础设施发展研究报告(2024)》中提到,全栈式服务,正在成为智算基础设施能否为用户提供优质AI服务的重要标志之一。智算基础设施应构筑全栈技术能力,方便用户使用智能算力。
服务提供商构建全栈生态,能让用户获得涵盖硬件、软件、算法、数据等各个方面的服务支持。这有助于智算的使用者,广大的开发群体和企业用户提高开发效率,减少开发成本。对智算服务提供方而言,全栈式服务的好处则在于能扩展潜在用户范围,增加服务客户的深度,增加客户粘性。
全栈式的能力包含从算力规划设计、中心建设和平台运营多个环节。目前宁畅能提供从集群搭建、业务接入、训推任务、集群运维、算力运营等贯穿算力中心全生命周期的设、建、运一体化服务。它也是“全局智算”战略和产品理念的反映。
全栈式的服务之下,宁畅精装算力能覆盖软硬件全体系及全液冷产品,可提供咨询、测试、运维、售后的全流程服务,满足各行业用户大模型开发、适配、部署的全场景需求,并能按用户发展阶段,定制专业且性价比高的AI计算方案,为企业的AI应用和落地提供了更好的支撑。
目前,精装算力理念,已经在互联网、医疗、科研、汽车等多个行业取得了显著成效,助力这些领域提升算力利用率,降低使用成本。
比如一些互联网企业也研发了自己的模型。他们希望能够加速模型研发进度,从而在激烈的市场竞争中保持优势。宁畅算力栈通过高效算力管理和GPU加速技术,就帮助某互联网企业缩短了模型训练周期、加速产品迭代,并提升了20%的算力利用率,有效加速了其业务的创新发展。
AI for Science方兴未艾,行业十分关注如何基于高效的基础设施来加速创新流程。某大学在宁畅算力栈助力下,不仅在物理模拟和气象预报中显著提高了运算速度,还在药物分子模拟研究中大幅缩短了计算时间。在该案例中,宁畅算力栈支持复杂的深度学习模型训练,加快了自然语言处理、图像识别等领域的研究进度,将计算时间最高节省了82%,科研工作效率提升20%,直接推动了科研成果的快速转化。
同样的情况还发生在医疗、汽车等多个行业。精装算力理念下,宁畅的算力栈,经受住了多家关键领域头部企业的需求考验,切实支持了这些企业的创新。
智算行业的比拼正进入新的阶段。接下来的智算中心建设,规模只是其中一个考量,更重要的是要比计算效率,比算力调度管理,也要比软件优化。精装算力的时代正在到来。
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.