和DeepSeek一樣強的公司,上海也潛伏一家

老胡看AI
02-12

近日,《麻省理工科技評論》(MIT Technology Review)發表文章《關注DeepSeek之外的四家中國人工智能初創公司》,聚焦階躍星辰(Stepfun)、面壁智能(ModelBest)、智譜AI(Zhipu)和無問芯穹(Infinigence AI)四家企業,認爲它們展現出不遜於DeepSeek的技術實力與全球競爭力。

此前,我們已經介紹過面壁智能、智譜AI、無問芯穹等公司,作爲一家專注於實現通用人工智能(AGI)的人工智能初創企業,階躍星辰成立於2023年4月,由前微軟全球副總裁姜大昕博士創立,以下是對這家公司的詳細分析。

1、成立背景和發展歷程

2023年4月,在人工智能領域快速發展、大模型成爲行業焦點的背景下,姜大昕博士創立了階躍星辰。公司名字靈感來自“階躍函數”(Step Function),使命是“智能階躍,十倍每一個人的可能”,總部位於上海市徐彙區。

作爲創始人,姜大昕博士擁有深厚的學術背景和豐富的業界經驗。他早年在紐約州立大學布法羅分校獲得計算機科學博士學位,隨後在新加坡南洋理工大學計算機科學與工程學院擔任助理教授。

2007年,姜大昕加入微軟亞洲研究院擔任首席研究員,開啓了他在微軟長達16年的職業生涯。在此期間,他在機器學習、數據挖掘、自然語言處理和生物信息學等領域積累了豐富的研究和工程經驗,並於2008年獲得SIGKDD最佳應用論文獎。

2011年,他轉入微軟亞洲互聯網工程院(STCA)工作。憑藉出色的表現,他於2017年晉升爲微軟全球合夥人,並擔任STCA副院長及首席科學家。

2023年3月,他進一步升任微軟副總裁,離職前,他領導着一支400多人的精英團隊,負責必應(Bing)的全球搜索體驗、AI School China以及NLP方向的技術研發工作。

在創立階躍星辰時,姜大昕看到了大模型在通用人工智能(AGI)方向的巨大發展空間。儘管當時這一領域面臨着技術研發難度大、數據隱私與安全、模型泛化能力等諸多挑戰,但他決心按照自己對AGI的理解,構建全新的技術體系和產品生態。

公司創立後,研發團隊於2023年7月起正式開始訓練模型,雖然初期保持低調,但發展速度驚人。

2023年8月,公司發佈首款大模型產品Step-1(千億參數語言大模型),標誌着技術研發的初步成果。同年11月,又完成了Step-1V(千億參數多模態大模型)的訓練,該模型在多模態理解能力上表現突出,支持圖像分析、邏輯推理、內容創作等任務,並在中國評估平臺“司南”中位列第一,性能對標GPT-4V。

2024年3月,階躍星辰在上海全球開發者先鋒大會上發佈Step-2(萬億參數MoE語言大模型)預覽版,成爲國內首家推出萬億參數模型的初創公司。

該模型採用混合專家(MoE)架構,聚焦深度智能探索,並開放API接口供合作伙伴試用。

到2024年11月,Step-2在LiveBench測評榜單中位列國產基座大模型第一,僅次於OpenAI o1和Claude;同月,Step-1V在LMSYS Chatbot Arena榜單中位列視覺領域中國大模型第一。

2024年12月,公司完成數億美元B輪融資,估值達20億美元,投資方包括上海國資、騰訊、五源資本等。

2025年1月,公司進一步發佈首款推理模型Step R-mini,具備主動規劃與深度邏輯推理能力,並在躍問網頁版全面上線。

在技術路線上,公司專注於通用人工智能(AGI)研發,提出“單模態→多模態→多模理解和生成的統一→世界模型→AGI”的發展路徑,並圍繞算力、系統、數據和算法四大要素進行綜合佈局。

算力方面,階躍星辰對外投資了上海智能算力科技有限公司,佔股10%,該公司核心股東還包括雲賽智聯、儀電集團等。

商業化方面,公司採取“基礎模型+AI應用”雙輪驅動戰略,推出To C產品“躍問”(效率工具)和“冒泡鴨”(AI開放世界平臺),同時聚焦重點行業構建大模型生態。

行業應用方面,階躍星辰與上海報業旗下界面財聯社達成深度合作,共同推進大模型在AIGC財經資訊、智能投研、智能投顧等領域的應用;此外,還與中文在線、中國知網等達成戰略合作,探索大模型在網絡文學創作、知識服務等領域的應用。

公司的技術實力也爲商業化積累了良好口碑。

2024年下半年,階躍星辰多模態API的調用量增長超45倍,Step系列模型已經積累了一批活躍的應用開發者。多個走紅社交網絡的AI應用,如“歌詞爆改機”、“胃之書”、“林間療愈室”等,均採用階躍星辰的多模態模型。

2、團隊構成和專業背景

階躍星辰的團隊人才密度較高,超過80%的頂尖AI學者和專家組成,涵蓋算法、系統、數據全鏈條,核心成員包括計算機視覺領域經典論文ResNet主要作者之一的張祥雨,以及曾任職於微軟、字節跳動、谷歌的AI系統專家的朱亦博。

姜大昕博士-創始人、CEO

姜大昕博士全面負責公司戰略規劃和技術產品研發。他本科畢業於中國科學技術大學,隨後在中國科學院軟件研究所獲得碩士學位,並於2005年在紐約州立大學布法羅分校獲得計算機科學博士學位。博士畢業後,他曾在新加坡南洋理工大學計算機科學與工程學院擔任助理教授。

2007年,姜大昕加入微軟亞洲研究院擔任首席研究員,開啓了他爲期16年的微軟職業生涯。2011年,他轉入微軟亞洲互聯網工程院(STCA),負責必應(Bing)搜索、Cortana智能助手、Azure認知服務等產品的技術研發。

他於2017年晉升爲微軟全球合夥人,並擔任STCA副院長及首席科學家。2023年3月,他進一步升任微軟全球副總裁,兼任亞洲軟件技術中心WebXT S+D集團總經理,領導着一支400多人的團隊。

學術成就方面,姜大昕在數據挖掘和自然語言處理領域擁有多項專利,已在SIGKDD、ACL、AAAI等國際頂級會議和期刊發表論文100餘篇,GoogleScholar統計的引用量超過1.7萬次,H-index達到53。

憑藉在上下文感知搜索和語言Scaling方法上的突出貢獻,他入選國際電氣和電子工程師協會(IEEE)2025年度Fellow名單,是唯一來自中國大模型創業公司的入選者。

張祥雨-首席科學家

張祥雨博士主要負責公司的技術戰略與核心算法研發。

他於2008年考入西安交通大學,後轉入軟件工程專業。在校期間,他在2011年美國大學生數學建模競賽(MCM)中獲得特等獎提名,創造了西安交大歷史最佳成績。

2012年獲得軟件工程學士學位後,他入選西安交通大學與微軟亞洲研究院(MSRA)的聯合博士培養項目,師從孫劍和何愷明。

在博士期間,張祥雨主導了ResNet的研究工作,負責底層框架和編碼實現。該研究成果獲得2016年CVPR最佳論文獎,論文引用量超過32萬次。此外,他還主導開發了ShuffleNet,推動了手機毫秒級人臉解鎖技術的實現。

2017年獲得博士學位後,他加入曠視科技,擔任曠視研究院基礎模塊組負責人和首席科學家。

張祥雨的研究方向覆蓋高性能卷積網絡設計、AutoML(自動化機器學習)、神經網絡架構搜索,以及深度模型的裁剪與加速等領域。他的論文總引用量超過32萬次,h-index達到59。

焦斌星-聯合創始人、數據負責人

焦斌星博士是階躍星辰的聯合創始人和數據負責人。他畢業於中國科學技術大學,併入選中科大與微軟亞洲研究院(MSRA)的聯合培養博士項目。

博士畢業後,他加入微軟,擔任必應引擎核心搜索團隊負責人,主要負責利用數據挖掘和NLP算法優化索引和搜索質量。在微軟期間,他還開發了全球高質量站點的自動挖掘算法,用於站點排序和索引,爲必應搜索引擎的性能提升做出了重要貢獻。

2023年,他與姜大昕博士共同創立階躍星辰,作爲核心創始團隊成員擔任數據負責人,爲公司的大模型研發提供關鍵的數據支持。

朱亦博-系統負責人

朱亦博博士是階躍星辰的核心創始團隊成員之一,擔任系統負責人和公司監事。他畢業於美國加州大學聖芭芭拉分校(UCSB),並在該校完成了博士學位。

在加入階躍星辰之前,朱亦博曾在微軟、字節跳動和Google等公司工作,積累了豐富的大規模系統建設經驗。他曾擔任字節跳動AI基礎設施負責人,在微軟期間也參與了大規模集羣與系統建設工作。

在階躍星辰,朱亦博主要負責系統方面的工作,包括構建和優化公司的大規模計算集羣,保障大模型訓練和運行時的系統穩定性和高效性,爲公司的模型研發和產品部署提供關鍵的系統支持。

3、主要產品

(1)Step系列基座模型

a. 文本大模型

當前階躍星辰已推出step-1和step-2正式版兩大系列文本大模型。

step-1

step-1系列千億參數經典架構大模型,能夠處理各種複雜的語言任務。無論是文本創作、跨語種交流,還是解答問題、邏輯推理等,它都能提高使用者工作效率。此外,該系列模型還具備出色的數學和代碼能力,在科學計算、程序開發等領域也能發揮重要作用。

step-1-flash

step-1系列極速版大模型,能夠處理通用領域的任務。在首字延遲和輸出速度上表現優異,爲高性價比模型。上下文長度爲8k,模型名爲step-1-flash。

step-2

新一代MoE架構大模型,參數規模突破萬億。模型性能/體感/planning能力全面逼近國際主流大模型,滿足用戶在中/英文領域各種需求。

step-2-mini

基於新一代自研Attention架構MFA的極速大模型,用極低成本達到和step1類似的效果,同時保持了更高的吞吐和更快響應時延。能夠處理通用任務,在代碼能力上具備特長,上下文長度爲8k。

step-2-16k-exp

step-2模型的實驗版本,包含最新的特性,滾動更新中。

b. 視覺理解大模型

視覺理解大模型在文本大模型的基礎上,增加了圖像和視頻輸入能力,以實現更全面、更準確的理解和推理。

step-1v

該模型擁有強大的圖像理解能力,暫時只開放文本和圖像輸入,且僅支持文本生成。上下文長度分別爲8k和32k。

step-1o-vision-32k

該模型擁有強大的圖像理解能力,暫時只開放文本和圖像輸入,且僅支持文本生成。上下文長度爲 32k。相比於 step-1v 系列模型,擁有更強的視覺性能。

step-1.5v-mini

該模型擁有強大的視頻理解能力,暫時只開放文本、圖像和視頻輸入,且僅支持文本生成。上下文長度爲 32k。

c. 語音大模型

階躍星辰語音模型基於業界先進的語音生成等技術,開放 TTS、音頻復刻、語音識別接口,幫助用戶實現音頻相關能力。可應用於智能客服、有聲閱讀、音視頻創作、遊戲NPC、會議記錄等應用場景。

step-asr

該模型具有強大的中英文語音識別能力,能夠自動區分語音和噪音,支持中英文混合語音識別,可廣泛應用於語音輸入、語音控制、會議記錄等場景。此外,該模型還具有強大的重口音普通話識別能力,支持識別多種不同地方的重口音普通話。

step-tts-mini

該模型具有強大的文字轉語音能力,在中英文混合輸入場景表現突出,可廣泛應用於有聲閱讀、音視頻創作等場景。

此外,該模型還具有強大的音頻復刻能力,僅需提供5-10秒的音源,即可極速復刻。支持中、英、日語復刻。

d. 生圖模型

文生圖模型是一種基於深度學習的模型,能夠根據給定的文本描述或其他形式的輸入,生成高質量、多樣化的圖像。生圖模型在藝術創作、設計、遊戲開發等領域具有廣泛的應用前景。

step-1x

該模型擁有強大的圖像生成能力,支持文本描述作爲輸入方式。具備原生的中文支持,能夠更好的理解和處理中文文本描述,並且能夠更準確地捕捉文本描述中的語義信息,並將其轉化爲圖像特徵,從而實現更精準的圖像生成。模型能夠根據輸入生成高分辨率、高質量的圖像,並具備一定的風格遷移能力。

(2)C端應用

智能助手躍問

支持多模態交互,可幫助用戶解決工作和生活場景下的各種問題,例如在創作方面提供創意、解答問答類問題、進行搜索等。

並且其多模態智能視覺搜索功能“拍照問”,是國內首個集成到iPhone16相機控制鍵中的大模型應用產品能力,用戶可以通過手機拍照直接進行視覺搜索,獲取相關信息。

AI開放世界平臺冒泡鴨

一個由劇情和角色組成的AI開放交互平臺,能滿足多種娛樂和社交需求。

4、融資情況

階躍星辰在成立後短時間內獲得多輪融資。最近的一次是B輪融資,於2024年12月完成,總融資金額達數億美元。

此次融資吸引了包括國資、戰略和財務投資人在內的多家機構參與,核心投資方包括上海國有資本投資有限公司及其旗下基金,以及騰訊投資、五源資本、啓明創投等知名投資機構。

這筆融資將用於繼續投入基礎模型研發,強化多模態和複雜推理能力,並通過產品和生態加大覆蓋C端應用場景,提供豐富的用戶體驗。

5、小結

作爲一家成立僅兩年的AI初創企業,階躍星辰已在大模型領域取得顯著成就。公司自研的Step系列模型在多個權威評測中表現優異,以姜大昕、張祥雨等爲代表的核心團隊,憑藉深厚的學術背景和豐富的工業界經驗,爲公司的持續創新提供了有力支撐。

展望未來,公司將繼續沿着“單模態→多模態→世界模型→AGI”的技術路線,爲中國AI產業的發展貢獻力量。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10