免費商用授權！阿里(09988)開源通義千問QwQ-32B 性能接近DeepSeek R1滿血版

智通財經APP獲悉，AI領域又有新動作！3月6日，阿里雲通義千問官方宣佈發布並開源全新的推理模型通義千問QwQ-32B。據了解，這款擁有325億參數的模型，其性能可與具備6710億參數(其中370億被激活)的DeepSeek-R1滿血版相媲美，並超過了OpenAI o1-mini。而且此次以Apache 2.0開源協議開源，意味着大家可以完全免費商用。二級市場上，阿里昨日在港股市場出現較大漲幅，截至目前，港股阿里巴巴-W(09988)報138港元，漲幅6.24%。

實際上，在去年11月28日，阿里就已經開源了預覽版的推理大模型QwQ-32B-Preview，彼時DeepSeek R1尚未發布，這應該是當時最早開源的推理大模型之一。三個月後的今天，QwQ-32B正式開源，去掉了預覽版的標籤。與之前的預覽版相比，正式版在上下文長度和AIME評分等方面有顯著提升，例如上下文長度從32K增加到131K，AIME評分提升了50%。

具體來看，QwQ-32B在多個基準測試中均表現出很強的競爭力，阿里雲對QwQ-32B 測試了數學推理、編程能力和通用能力，並展示了 QwQ-32B 與其他領先模型的性能對比，包括DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini以及原始的DeepSeek-R1。

在測試數學能力的AIME24評測集上，以及評估代碼能力的LiveCodeBench中，千問QwQ-32B表現與 DeepSeek-R1 相當，遠勝於o1-mini及相同尺寸的 R1 蒸餾模型；在由Meta首席科學家楊立昆領銜的「最難 LLMs評測榜」LiveBench、谷歌等提出的指令遵循能力IFEval評測集、由加州大學伯克利分校等提出的評估準確調用函數或工具方面的BFCL測試中，千問QwQ-32B的得分均超越了DeepSeek- R1。

目前，QwQ-32B已在Hugging Face和ModelScope開源，並採用了Apache 2.0開源協議，用戶可以免費體驗其強大的推理能力。

在致力於開發下一代Qwen的過程中，阿里雲計劃將更強大的基礎模型與依託規模化計算資源的RL相結合，從而使其更接近實現人工通用智能。此外，阿里雲正積極探索將智能體與RL集成，以實現長時推理。

免責聲明：投資有風險，本文並非投資建議，以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請，作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考，不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證，投資者應自行研究並在投資前尋求專業建議。

老虎證券

免費商用授權！阿里(09988)開源通義千問QwQ-32B 性能接近DeepSeek R1滿血版

熱議股票