爆发了,阿里的云!

蓝鲸财经
11 Mar

文|华商韬略 王恺文

苹果最终选择了阿里巴巴作为它们在中国的本地化合作伙伴”!

2月13日,在迪拜举办的World Governments Summit 2025峰会上,阿里巴巴董事局主席蔡崇信自豪地宣布了这则消息。

他还表示,阿里巴巴与苹果的合作,将不仅仅局限于手机服务领域,未来还将涉及更多的业务板块。

当媒体都在惊叹与讨论苹果为什么选择阿里巴巴时,背后真正的主角还需要加上一个“云”字。

长期以来,相比淘宝、天猫、菜鸟,“阿里云”无论是在集团内部,还是在公众眼中,往往都被放到更“次”一点的位置,但现在,情况开始不一样了。

2009年1月,马云与阿里云研发团队留下了合影,宣告着阿里正式踏入了云计算领域。

春节后开工第一天,这群年轻人在北京上地汇众大厦一间快要废弃的办公室里,写下了阿里云计算操作系统“飞天”的第一行代码。

刚刚成立的阿里云,最要紧的任务是帮助公司解决“底层能力扩容问题”,说得直白点,阿里的服务器快撑不住了,而且他们希望自己下场而不是靠外力来解决问题。

从2008年开始,随着用户数量与交易频次的高速增长,淘宝与支付宝服务器多次濒临崩溃。

仅是支撑平台的日常运行,公司服务器占用率经常都能跑到98%,而用户与交易增量丝毫没有放缓之势,若不有所行动,剩余2%的空间将很快被耗尽,服务器只会频繁宕机。

同样,作为承担海量交易数据的电商平台,若自家服务器算力受限,还会极大地约束平台自身的商品信息与交易的承载量,成为扼制阿里增长的短板。

阿里已经是飞速行驶的列车,作为“铁轨”的服务器若不牢靠,阿里恐将脱轨!

更让马云焦头烂额的不止于此,公司当时采用的“IOE架构”,已无法从“堆量”上解决问题。

2008年,中国互联网公司普遍使用IOE作为内部系统解决方案,这三个大写字母分别指代了:服务器供应商IBM、数据库供应商Oracle、储存供应商EMC。

作为海外成熟的系统设备,服务普通公司业务绰绰有余,但面对阿里节节攀升的算力需求,就显得十分捉襟见肘。

IOE扩容需要购买大量单价几十万元的IBM小型机、储存设备以及价值几千万的商业数据库,在软硬件的未来维护上更是大笔费用,更重要的是,这些外国系统从未承载过阿里当时上亿的用户量,即使砸钱堆量,效果也不一定见得好。

2008年中旬,事感刻不容缓的马云决定自力更生,另起炉灶,他从微软亚洲研究院挖来了曾担任过副院长的王坚博士,而王坚立马也帮马云算了一笔账——“不搞云计算新架构,光买IOE软硬件都能让阿里破产”。

阿里不能停,云计算更不能停,阿里云开始与时间赛跑了起来。

只是没想到,众人以为的全力冲刺,变成了坎坷的长跑。

2009年,作为阿里云“飞天”系统首席架构师的王坚,面对淘宝与阿里金融在“大规模数据计算”方面的急迫需求,对内率先启动了“云梯计划”,以证明云计算替代IOE的可行性。

“云梯计划”采用了“云梯1”与“云梯2”两种技术路径来进行内部赛马,前者基于开源软件Hadoop研发计算系统,后者基于阿里巴巴自主研发的“飞天”系统,构建全新的数据计算架构。

结果阿里云的代码还没写多少,阿里技术部门的八十多位工程师先不干了。

因为此时无论哪个云梯都只算“半成品”,根本无法有效替换现有系统,只能实验性地承担一些重要负载,为未来争取时间。

据阿里技术保障部时任负责人振飞回忆,当时为了说服工程师放弃Oracle转投“飞天”,阿里云一度选择了“三年期限,新架构下淘宝核心交易系统必须零故障”的超级赌约。

2009年深秋时分,阿里Oracle工程师们亲手拆掉了自己熟悉的系统,却没能等来想象中的顺畅升级,这算是阿里云第一次被推上风口浪尖。

“列车一边开,一边在旁边铺新轨道”足以形容当时的焦灼,但在无缝切换完轨道后,率先接入“飞天”的淘宝与阿里金融却表示十分难受。

无论是技术端还是非技术端,大部分员工都在抱怨“飞天”难用,比起老系统,处理速度慢、系统漏洞多、计算稳定性还差,关键是算力危机并未得到明显改善,甚至短期内还加剧了服务器紧张。

阿里内部搜索业务部门曾发现,以前本来花一台服务器就能搞定的需求,在阿里云却需要花几十台服务器。

当时研发工程师王国涛吐槽:“明明可以坐高铁,却偏偏要骑自行车去上海”。

直到2010春节过后,阿里云经历一次重大版本升级,才暂时稳定住了局势。

不过,彼时“云梯计划”尚未分晓,淘宝与阿里金融在公司内部看来也是“被迫与阿里云握手”,想要真正成为阿里各项业务通用的大数据计算平台,飞天必须突破“5K瓶颈”。

“5K”指拥有独自调度5000台服务器的能力,面对当年的内部需求,只有突破了这5K的门槛,才能证明“飞天”有资格负担阿里巴巴的底层计算系统。

短暂喘息之后,阿里云却一口气憋三年,差点窒息。

▲王坚与马云

从2010年到2012年,阿里云全团队没日没夜地加班都未能突破这一瓶颈,在几乎尝试了一切能想到的技术策略,只留下了一个接一个的系统错误后,王坚与团队陷入了绝望。

从诞生起就受到质疑的阿里云,也遭到了更大的非议。

公司内部都在叫王坚“骗子”,质疑他的技术,抨击他的管理,甚至怀疑他这个心理学博士到底会不会写代码?

每年公司内部拼比,阿里云稳拿倒数第一,核心团队出走,部门离职率高达70%,“阿里云部门被裁撤”的流言更是满天飞。

在2011年底,时任阿里金融总裁的胡晓明,一度忍无可忍地带着团队冲到王坚办公室,发出了最后的通牒——“如果再不解决问题,春节后就放弃阿里云”!

公司之外,李彦宏在2010年的中国IT领袖峰会上说:“云计算这个东西,不客气地讲,是新瓶装旧酒”;马化腾也同样表示:“这个事情过了几百年、一千年后有可能,但现在还为时过早了”,这几乎在明示该领域的市场前景堪忧。

彼时已是全球云服务商龙头的亚马逊,也扬言旗下云计算平台AWS预计在2013年进军中国市场,这对还在“技术襁褓”状态的阿里云来说,威胁巨大。

内外高压的环境下,王坚在坚持,但现实依旧骨感。

直到2012年底,开源基础的“云梯1”已突破了4000台集群调度的标准,而阿里云自研的“云梯2”,即“飞天”,仍只有1500台。

被炒作为世界末日的2012年,阿里云真正感受到了“世界末日”,积攒的压力最终在2012年的部门年会上爆发,王坚泣不成声:“这两年我挨的骂甚至比我一辈子挨的骂还多”。

名字虽叫飞天,但众人眼里的阿里云,似乎快要“坠毁”。

这段黑暗摸索期内,金融负责人胡晓明实在受不了阿里云的不争气之后,曾希望放弃阿里云选择其他路径,并在西湖湖畔向马云诉苦:“马总,您能不能放我一马?”

马云回答地很确切:“不可以,阿里云是未来”。

在此之后,马云对着阿里巴巴集团所有人斩钉截铁地表示:“我每年给阿里云投10个亿,投个十年,做不出来再说”,流言蜚语终才平息。

时间步入2013年,两架云梯依旧未能突破“5K瓶颈”,而更坏的消息出现了。

集团技术保障部表示,按照当下业务增长趋势,两架云梯系统的储存与算力将在当年6月到顶,2008年火烧眉毛的场景若隐若现,现在要是服务器出问题,影响只会比几年前更大更广。

“冲上5K”成了阿里云的“背水一战”,马云有耐心,但现实留下的时间真不多了。

为此,阿里云召集了整个集团的技术骨干协同攻关,并且破釜沉舟,痛下决心把“云梯1”计划放弃,倾尽剩下所有的资源与时间,全力让自主的“飞天”架构飞跃5K大关。

在服务器快要到顶的最后关头,2013年6月,阿里云终于突破5K瓶颈,自研的飞天系统完成了最后的考验,后来王坚回忆这段时间,感慨:“阿里云是拿命换来的”。

▲王坚与飞天纪念碑

在决定组建阿里云之前,马云坦言:“谁也不知道云计算未来会是什么样子,只是相信,这是未来,是趋势”。

没想到,这个未来的确足够长,仅仅让自己能用,就用了整整5年。

但这5年意义重大,能让阿里自己用,也就是能让几乎所有企业用了,突破5K大关,意味着,阿里在云计算能力、性能和架构等方面达到了全球领先水平。

阿里云也成为了中国真正意义上的第一家云计算企业。

更重要的,这是阿里自主研发的系统,而且面向未来做出了优势:

相比于极其依赖硬件的传统IOE系统,“飞天”能发挥云计算的弹性算力特性,不仅能更加灵活地服务阿里内部各部门,还能将算力“零售化”,无论大中小企业,都能使用云服务,至此,阿里在云端取代了IOE,用新的运算力“基础设施”杀入了新市场。

2013年5月17日,阿里集团最后一台IBM小型机在支付宝下线,在2008年提出“去IOE”的五年后,阿里内部不再使用国外系统,实现了完全自主。

云计算是全球科技巨头竞争的核心战场之一,阿里云的突破也意味着,它将在一个全新的市场——全球云计算市场展开旅程,并一出手就与亚马逊AWS、微软Azure等并肩挑战。

此时,完成了使命的王坚卸任,当年与阿里云“相爱相杀”的胡晓明成了下一任总裁。

胡晓明制定了阿里云新时期的全新战略,用技术拓展商业边界,用商业推动技术发展。

而其实现这一目标的核心,正如当初马云要求的那样,便宜,好用。

2014年,作为国内最早有能力提供云计算服务的互联网公司,阿里云敏锐地察觉到,中国正在进入数字化转型的探索时期,云服务的主力对象应该是中小型开发者,数字化同样也是政府与政策关心的方向,于是决定借助先发优势,全面拥抱这波数字化浪潮。

事实证明,阿里云选对了时间,选对了道路。

此时恰逢国内移动互联网创业大潮的前夕,阿里云用性价比收获了一大批初创公司的订单,也支持陪伴了一批新兴巨头的成长,单车大战、网约车之战、短视频之战等风起云涌的业内大战,阿里云从未缺席,这些互联网赛道爆发出的庞大云计算资源需求,都被它逐一满足。

其中最典型的案例莫过于字节跳动的崛起。

随着今日头条、抖音等明星产品的接连出现,字节服务器在短期内难以承接数亿级的新用户涌入,这时只有阿里云能填补上如此庞大的算力与储存缺口。

作为字节崛起之路上的“卖铲人”,阿里云同样获得了丰厚回报,字节跳动曾向阿里云单季度贡献了7%-8%的收入。

规模效益下,阿里云的算力成本与储存成本得以持续下降,并将更便宜的算力带给业界,也因此与友商展开竞争。一家位于北京的云计算企业回忆当年阿里云降价:“第一次降价是有些惊讶,但是一年降6次价就完全措手不及了。”

在先发优势与资源优势的双加持下,2014年-2019年间的阿里云在中国几乎没有对手。

2015年-2019年,阿里云营收从30亿元涨到400亿元,4年营收翻近20倍,成长为亚洲最大、全球前三的云计算公司,也成为阿里集团的重要一极。

打江山难,守住江山更难,在阿里云的带动和培育下,国内云市场蓬勃发展,这让阿里做大了蛋糕,但也持续面临被分蛋糕的挑战。

天翼云、移动云、联通云等“运营商云”国家队的出现,分走了不少国有体制内的蛋糕,华为云、腾讯云、京东云也持续发力,在市场上截胡,而阿里陪伴起来的客户做大做强之后,不但研发“自有云”,断了阿里的业务,甚至还反过来成为阿里云的对手。

与之对应,是阿里云的增速持续放缓。2019财年到2023财年,其营收增速从84%到62%、50%、23%、3.5%,一路下滑。

而且,直到2022年,阿里云才实现了创立十三年来的首次盈利,而届时营收已经破了千亿。

外界环境天翻地覆,阿里内部也迎来巨变期,可谓的内忧外患之下,阿里云要往哪里去,阿里云是不是已经平庸了,老化了,甚至要掉队了的声音,也开始多了起来。

而现在回头看,就在不断放大的疑问声中,阿里云新的蝶变也在加速中。

今年春节期间,阿里云发布了通义千问最新旗舰版模型:Qwen2.5-Max。

2月4日,第三方基准测试平台Chatbot Arena公布了最新的大模型盲测榜单,该模型以1332的高分位列全球第七名。

Qwen2.5-Max超越DeepSeek V3、o1-mini和Claude-3.5-Sonnet等模型,成为了非推理类的中国大模型冠军,其在数学与编程单项能力上排名世界第一,硬提示方面名列世界第二。

早在2019年,阿里云就开始研究布局Qwen大模型,也由此加快了走进AI时代的步伐。

如今,继成为中国最大云计算厂商后,阿里云也成了中国大模型开源力度最大的科技公司。

当初考虑到率先服务内部、维护技术壁垒、国内开源商业模式匮乏等综合原因,“飞天”最终选择了闭源,但也因此放弃了开放技术生态的构建。

闭源的“飞天”只能依靠阿里云自己维护与发展,不利于全球开发者们协同共建,最终使得技术生态相对封闭,开发成本高,迭代速度慢,难以推动全球化的行业标准形成。

不过Qwen的出现,阿里不仅逆转了局势,更是完成了从反超到领跑!

阿里云是国内最早也是唯一开源自研大模型的“大厂”,也是全球唯一一家积极研发先进AI模型并且全方位开源的云计算厂商。

在Deepseek横空出世之前,阿里云Qwen开源系列大模型已是国内外最火的产品,其全球衍生模型迄今已突破9万个,总数量位列全球第一。

根据全球最大AI开源社区Hugging Face最新发布的开源大模型榜单,排名前十的开源大模型全部是基于Qwen二次训练生成出的衍生模型,可谓影响力巨大。

在全球大模型争相竞争的当下,阿里云“全尺寸、全模态、多场景”的开源意味着大幅降低个人与企业开发者的使用门槛,在大模型普及阶段抢占市场份额,形成事实上的行业标准,增加生态黏性。

一边是拥抱开源,开放共赢,另一边阿里云也没有忘记“便宜,好用”的初心。

阿里云CTO周靖人在云栖大会上发言:“相对未来的庞大应用,今天的价格还是太贵,大量开发者无法有效地大规模使用,只有降低价格,才能推动 AI应用爆发”。

后续随着Qwen系列主力模型降价85%,百万Tokens价格低至0.3元,周靖人自信表示:“这些新动作会进一步刺激开发者和各行各业客户使用大模型的需求”。

不过,阿里对AI的想象与应用可不止于此。

阿里巴巴CEO吴泳铭透露:“阿里已经看到了内部应用和AI相结合的多方面机会,无论是作为生活消费入口的淘天,还是搜索领域的夸克,办公领域的钉钉,都将会在AI的重塑下获得新发展空间,将会为用户带来更大的价值”。

阿里内部行动迅速,淘天、阿里妈妈、1688、闲鱼等核心事业部门已被明确要求与阿里云Qwen大模型团队完成深度沟通合作,尽快完成业务模式上的AI转型,而作为阿里AI To C的代表产品,夸克近期升级了品牌Slogan——“2亿人的AI全能助手”,足见其野心。

对外,阿里云企业级大模型开发平台“百炼”,已集成国内外两百多款大模型API,进一步降低模型调用成本,目前,一汽、金山、哈啰集团、国家天文台等超70万企业和机构在使用该平台。

借助完善的AI云基础设施建设与大模型迭代,阿里云仍在持续加速融入各行各业,近期正与国家电网、中央广播电视总台、招商银行、中华财险、杭州地铁集团、魅族、雷鸟等各行业组织围绕深度用云与AI应用落地展开广泛合作。

更多的决心与成绩,也已然体现在了阿里的财报上。

从2021财年至2024财年,阿里合计投入了2217亿的研发预算,年均投入超500亿,整个阿里集团也已把AI作为2025年集团整体的发力点之一,宣布未来3年的投入将超过去10年总和。

2月20日,吴泳铭在晚财报电话会议上重点提及:“未来三年,阿里将围绕AI这个战略核心,在AI基础设施、基础模型平台及AI原生应用、现有业务的AI转型等三方面加大投入”。

阿里坚定表示,未来将继续投入3800亿元人民币的巨额资金,选择一如既往相信未来、投资未来。

这也将创下我国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录之一。

目前从回报上看,AI已经带给了阿里立竿见影的增长,随着AI相关产品采用量的提升,阿里云本季度收入同比增长了11%,达到了317.42亿人民币,增速重回两位数时代,AI相关产品收入连续六季度保持三位数增长。

在更远的将来,阿里对AI饱和式的投入或许会撑起更大的想象。

“人工通用智能”(AGI)是阿里巴巴在AI时代追求的最高目标,在吴泳铭看来,生成式AI最大的想象力,绝不是在手机上做一两个新的超级App,而是接管数字世界、改变物理世界!

在追逐该目标的过程中,阿里云作为曾经的“云计算基建者”,将会从底层软硬基建中转型,转而从更高的技术层面完成全栈数字革命,触达AI计算体系的各方各面,成为新技术生态的搭建者与布道者。

“阿里云智能事业群”就是阿里云在AI时代的注解。

从云计算到AI时代,试错的成本远低于错过的成本,阿里云一次次用自己证明了这句话。

曾经被众人嫌弃的“成本部门”,如今再次用技术为阿里赋能,走到了聚光灯下。

2008年被淘宝服务器搞崩溃的马云,没想到一念的坚持,换来阿里通往AI时代的船票,而这张票的意义,会在16年后才被真正看到……

[1]《阿里云的时代,没了?》36氪

[2]《阿里云四大金刚简史》界面新闻

[3]《复盘:阿里云这十年》亿欧网

[4]《该重新打量阿里了》AI燎原

[5]《2024年12月份季度报告》阿里巴巴

[6]《阿里云这群疯子》浅黑科技

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10