和DeepSeek一樣強的公司，上海也潛伏一家

老胡看AI

02-12

近日，《麻省理工科技評論》（MIT Technology Review）發表文章《關注DeepSeek之外的四家中國人工智能初創公司》，聚焦階躍星辰（Stepfun）、面壁智能（ModelBest）、智譜AI（Zhipu）和無問芯穹（Infinigence AI）四家企業，認爲它們展現出不遜於DeepSeek的技術實力與全球競爭力。

此前，我們已經介紹過面壁智能、智譜AI、無問芯穹等公司，作爲一家專注於實現通用人工智能（AGI）的人工智能初創企業，階躍星辰成立於2023年4月，由前微軟全球副總裁姜大昕博士創立，以下是對這家公司的詳細分析。

1、成立背景和發展歷程

2023年4月，在人工智能領域快速發展、大模型成爲行業焦點的背景下，姜大昕博士創立了階躍星辰。公司名字靈感來自“階躍函數”（Step Function），使命是“智能階躍，十倍每一個人的可能”，總部位於上海市徐彙區。

作爲創始人，姜大昕博士擁有深厚的學術背景和豐富的業界經驗。他早年在紐約州立大學布法羅分校獲得計算機科學博士學位，隨後在新加坡南洋理工大學計算機科學與工程學院擔任助理教授。

2007年，姜大昕加入微軟亞洲研究院擔任首席研究員，開啓了他在微軟長達16年的職業生涯。在此期間，他在機器學習、數據挖掘、自然語言處理和生物信息學等領域積累了豐富的研究和工程經驗，並於2008年獲得SIGKDD最佳應用論文獎。

2011年，他轉入微軟亞洲互聯網工程院（STCA）工作。憑藉出色的表現，他於2017年晉升爲微軟全球合夥人，並擔任STCA副院長及首席科學家。

2023年3月，他進一步升任微軟副總裁，離職前，他領導着一支400多人的精英團隊，負責必應（Bing）的全球搜索體驗、AI School China以及NLP方向的技術研發工作。

在創立階躍星辰時，姜大昕看到了大模型在通用人工智能（AGI）方向的巨大發展空間。儘管當時這一領域面臨着技術研發難度大、數據隱私與安全、模型泛化能力等諸多挑戰，但他決心按照自己對AGI的理解，構建全新的技術體系和產品生態。

公司創立後，研發團隊於2023年7月起正式開始訓練模型，雖然初期保持低調，但發展速度驚人。

2023年8月，公司發佈首款大模型產品Step-1（千億參數語言大模型），標誌着技術研發的初步成果。同年11月，又完成了Step-1V（千億參數多模態大模型）的訓練，該模型在多模態理解能力上表現突出，支持圖像分析、邏輯推理、內容創作等任務，並在中國評估平臺“司南”中位列第一，性能對標GPT-4V。

2024年3月，階躍星辰在上海全球開發者先鋒大會上發佈Step-2（萬億參數MoE語言大模型）預覽版，成爲國內首家推出萬億參數模型的初創公司。

該模型採用混合專家（MoE）架構，聚焦深度智能探索，並開放API接口供合作伙伴試用。

到2024年11月，Step-2在LiveBench測評榜單中位列國產基座大模型第一，僅次於OpenAI o1和Claude；同月，Step-1V在LMSYS Chatbot Arena榜單中位列視覺領域中國大模型第一。

2024年12月，公司完成數億美元B輪融資，估值達20億美元，投資方包括上海國資、騰訊、五源資本等。

2025年1月，公司進一步發佈首款推理模型Step R-mini，具備主動規劃與深度邏輯推理能力，並在躍問網頁版全面上線。

在技術路線上，公司專注於通用人工智能（AGI）研發，提出“單模態→多模態→多模理解和生成的統一→世界模型→AGI”的發展路徑，並圍繞算力、系統、數據和算法四大要素進行綜合佈局。

算力方面，階躍星辰對外投資了上海智能算力科技有限公司，佔股10%，該公司核心股東還包括雲賽智聯、儀電集團等。

商業化方面，公司採取“基礎模型+AI應用”雙輪驅動戰略，推出To C產品“躍問”（效率工具）和“冒泡鴨”（AI開放世界平臺），同時聚焦重點行業構建大模型生態。

行業應用方面，階躍星辰與上海報業旗下界面財聯社達成深度合作，共同推進大模型在AIGC財經資訊、智能投研、智能投顧等領域的應用；此外，還與中文在線、中國知網等達成戰略合作，探索大模型在網絡文學創作、知識服務等領域的應用。

公司的技術實力也爲商業化積累了良好口碑。

2024年下半年，階躍星辰多模態API的調用量增長超45倍，Step系列模型已經積累了一批活躍的應用開發者。多個走紅社交網絡的AI應用，如“歌詞爆改機”、“胃之書”、“林間療愈室”等，均採用階躍星辰的多模態模型。

2、團隊構成和專業背景

階躍星辰的團隊人才密度較高，超過80%的頂尖AI學者和專家組成，涵蓋算法、系統、數據全鏈條，核心成員包括計算機視覺領域經典論文ResNet主要作者之一的張祥雨，以及曾任職於微軟、字節跳動、谷歌的AI系統專家的朱亦博。

姜大昕博士-創始人、CEO

姜大昕博士全面負責公司戰略規劃和技術產品研發。他本科畢業於中國科學技術大學，隨後在中國科學院軟件研究所獲得碩士學位，並於2005年在紐約州立大學布法羅分校獲得計算機科學博士學位。博士畢業後，他曾在新加坡南洋理工大學計算機科學與工程學院擔任助理教授。

2007年，姜大昕加入微軟亞洲研究院擔任首席研究員，開啓了他爲期16年的微軟職業生涯。2011年，他轉入微軟亞洲互聯網工程院（STCA），負責必應（Bing）搜索、Cortana智能助手、Azure認知服務等產品的技術研發。

他於2017年晉升爲微軟全球合夥人，並擔任STCA副院長及首席科學家。2023年3月，他進一步升任微軟全球副總裁，兼任亞洲軟件技術中心WebXT S+D集團總經理，領導着一支400多人的團隊。

學術成就方面，姜大昕在數據挖掘和自然語言處理領域擁有多項專利，已在SIGKDD、ACL、AAAI等國際頂級會議和期刊發表論文100餘篇，GoogleScholar統計的引用量超過1.7萬次，H-index達到53。

憑藉在上下文感知搜索和語言Scaling方法上的突出貢獻，他入選國際電氣和電子工程師協會（IEEE）2025年度Fellow名單，是唯一來自中國大模型創業公司的入選者。

張祥雨-首席科學家

張祥雨博士主要負責公司的技術戰略與核心算法研發。

他於2008年考入西安交通大學，後轉入軟件工程專業。在校期間，他在2011年美國大學生數學建模競賽（MCM）中獲得特等獎提名，創造了西安交大歷史最佳成績。

2012年獲得軟件工程學士學位後，他入選西安交通大學與微軟亞洲研究院（MSRA）的聯合博士培養項目，師從孫劍和何愷明。

在博士期間，張祥雨主導了ResNet的研究工作，負責底層框架和編碼實現。該研究成果獲得2016年CVPR最佳論文獎，論文引用量超過32萬次。此外，他還主導開發了ShuffleNet，推動了手機毫秒級人臉解鎖技術的實現。

2017年獲得博士學位後，他加入曠視科技，擔任曠視研究院基礎模塊組負責人和首席科學家。

張祥雨的研究方向覆蓋高性能卷積網絡設計、AutoML（自動化機器學習）、神經網絡架構搜索，以及深度模型的裁剪與加速等領域。他的論文總引用量超過32萬次，h-index達到59。

焦斌星-聯合創始人、數據負責人

焦斌星博士是階躍星辰的聯合創始人和數據負責人。他畢業於中國科學技術大學，併入選中科大與微軟亞洲研究院（MSRA）的聯合培養博士項目。

博士畢業後，他加入微軟，擔任必應引擎核心搜索團隊負責人，主要負責利用數據挖掘和NLP算法優化索引和搜索質量。在微軟期間，他還開發了全球高質量站點的自動挖掘算法，用於站點排序和索引，爲必應搜索引擎的性能提升做出了重要貢獻。

2023年，他與姜大昕博士共同創立階躍星辰，作爲核心創始團隊成員擔任數據負責人，爲公司的大模型研發提供關鍵的數據支持。

朱亦博-系統負責人

朱亦博博士是階躍星辰的核心創始團隊成員之一，擔任系統負責人和公司監事。他畢業於美國加州大學聖芭芭拉分校（UCSB），並在該校完成了博士學位。

在加入階躍星辰之前，朱亦博曾在微軟、字節跳動和Google等公司工作，積累了豐富的大規模系統建設經驗。他曾擔任字節跳動AI基礎設施負責人，在微軟期間也參與了大規模集羣與系統建設工作。

在階躍星辰，朱亦博主要負責系統方面的工作，包括構建和優化公司的大規模計算集羣，保障大模型訓練和運行時的系統穩定性和高效性，爲公司的模型研發和產品部署提供關鍵的系統支持。

3、主要產品

（1）Step系列基座模型

a. 文本大模型

當前階躍星辰已推出step-1和step-2正式版兩大系列文本大模型。

step-1

step-1系列千億參數經典架構大模型，能夠處理各種複雜的語言任務。無論是文本創作、跨語種交流，還是解答問題、邏輯推理等，它都能提高使用者工作效率。此外，該系列模型還具備出色的數學和代碼能力，在科學計算、程序開發等領域也能發揮重要作用。

step-1-flash

step-1系列極速版大模型，能夠處理通用領域的任務。在首字延遲和輸出速度上表現優異，爲高性價比模型。上下文長度爲8k，模型名爲step-1-flash。

step-2

新一代MoE架構大模型，參數規模突破萬億。模型性能/體感/planning能力全面逼近國際主流大模型，滿足用戶在中/英文領域各種需求。

step-2-mini

基於新一代自研Attention架構MFA的極速大模型，用極低成本達到和step1類似的效果，同時保持了更高的吞吐和更快響應時延。能夠處理通用任務，在代碼能力上具備特長，上下文長度爲8k。

step-2-16k-exp

step-2模型的實驗版本，包含最新的特性，滾動更新中。

b. 視覺理解大模型

視覺理解大模型在文本大模型的基礎上，增加了圖像和視頻輸入能力，以實現更全面、更準確的理解和推理。

step-1v

該模型擁有強大的圖像理解能力，暫時只開放文本和圖像輸入，且僅支持文本生成。上下文長度分別爲8k和32k。

step-1o-vision-32k

該模型擁有強大的圖像理解能力，暫時只開放文本和圖像輸入，且僅支持文本生成。上下文長度爲 32k。相比於 step-1v 系列模型，擁有更強的視覺性能。

step-1.5v-mini

該模型擁有強大的視頻理解能力，暫時只開放文本、圖像和視頻輸入，且僅支持文本生成。上下文長度爲 32k。

c. 語音大模型

階躍星辰語音模型基於業界先進的語音生成等技術，開放 TTS、音頻復刻、語音識別接口，幫助用戶實現音頻相關能力。可應用於智能客服、有聲閱讀、音視頻創作、遊戲NPC、會議記錄等應用場景。

step-asr

該模型具有強大的中英文語音識別能力，能夠自動區分語音和噪音，支持中英文混合語音識別，可廣泛應用於語音輸入、語音控制、會議記錄等場景。此外，該模型還具有強大的重口音普通話識別能力，支持識別多種不同地方的重口音普通話。

step-tts-mini

該模型具有強大的文字轉語音能力，在中英文混合輸入場景表現突出，可廣泛應用於有聲閱讀、音視頻創作等場景。

此外，該模型還具有強大的音頻復刻能力，僅需提供5-10秒的音源，即可極速復刻。支持中、英、日語復刻。

d. 生圖模型

文生圖模型是一種基於深度學習的模型，能夠根據給定的文本描述或其他形式的輸入，生成高質量、多樣化的圖像。生圖模型在藝術創作、設計、遊戲開發等領域具有廣泛的應用前景。

step-1x

該模型擁有強大的圖像生成能力，支持文本描述作爲輸入方式。具備原生的中文支持，能夠更好的理解和處理中文文本描述，並且能夠更準確地捕捉文本描述中的語義信息，並將其轉化爲圖像特徵，從而實現更精準的圖像生成。模型能夠根據輸入生成高分辨率、高質量的圖像，並具備一定的風格遷移能力。

（2）C端應用

智能助手躍問

支持多模態交互，可幫助用戶解決工作和生活場景下的各種問題，例如在創作方面提供創意、解答問答類問題、進行搜索等。

並且其多模態智能視覺搜索功能“拍照問”，是國內首個集成到iPhone16相機控制鍵中的大模型應用產品能力，用戶可以通過手機拍照直接進行視覺搜索，獲取相關信息。

AI開放世界平臺冒泡鴨

一個由劇情和角色組成的AI開放交互平臺，能滿足多種娛樂和社交需求。

4、融資情況

階躍星辰在成立後短時間內獲得多輪融資。最近的一次是B輪融資，於2024年12月完成，總融資金額達數億美元。

此次融資吸引了包括國資、戰略和財務投資人在內的多家機構參與，核心投資方包括上海國有資本投資有限公司及其旗下基金，以及騰訊投資、五源資本、啓明創投等知名投資機構。

這筆融資將用於繼續投入基礎模型研發，強化多模態和複雜推理能力，並通過產品和生態加大覆蓋C端應用場景，提供豐富的用戶體驗。

5、小結

作爲一家成立僅兩年的AI初創企業，階躍星辰已在大模型領域取得顯著成就。公司自研的Step系列模型在多個權威評測中表現優異，以姜大昕、張祥雨等爲代表的核心團隊，憑藉深厚的學術背景和豐富的工業界經驗，爲公司的持續創新提供了有力支撐。

展望未來，公司將繼續沿着“單模態→多模態→世界模型→AGI”的技術路線，爲中國AI產業的發展貢獻力量。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

和DeepSeek一樣強的公司，上海也潛伏一家

熱議股票