智通財經APP獲悉,AI領域又有新動作!3月6日,阿里雲通義千問官方宣佈發佈並開源全新的推理模型通義千問QwQ-32B。據瞭解,這款擁有325億參數的模型,其性能可與具備6710億參數(其中370億被激活)的DeepSeek-R1滿血版相媲美,並超過了OpenAI o1-mini。而且此次以Apache 2.0開源協議開源,意味着大家可以完全免費商用。二級市場上,阿里昨日在港股市場出現較大漲幅,截至目前,港股阿里巴巴-W(09988)報138港元,漲幅6.24%。
實際上,在去年11月28日,阿里就已經開源了預覽版的推理大模型QwQ-32B-Preview,彼時DeepSeek R1尚未發佈,這應該是當時最早開源的推理大模型之一。三個月後的今天,QwQ-32B正式開源,去掉了預覽版的標籤。與之前的預覽版相比,正式版在上下文長度和AIME評分等方面有顯著提升,例如上下文長度從32K增加到131K,AIME評分提升了50%。
具體來看,QwQ-32B在多個基準測試中均表現出很強的競爭力,阿里雲對QwQ-32B 測試了數學推理、編程能力和通用能力,並展示了 QwQ-32B 與其他領先模型的性能對比,包括DeepSeek-R1-Distilled-Qwen-32B、DeepSeek-R1-Distilled-Llama-70B、o1-mini以及原始的DeepSeek-R1。
在測試數學能力的AIME24評測集上,以及評估代碼能力的LiveCodeBench中,千問QwQ-32B表現與 DeepSeek-R1 相當,遠勝於o1-mini及相同尺寸的 R1 蒸餾模型;在由Meta首席科學家楊立昆領銜的“最難 LLMs評測榜”LiveBench、谷歌等提出的指令遵循能力IFEval評測集、由加州大學伯克利分校等提出的評估準確調用函數或工具方面的BFCL測試中,千問QwQ-32B的得分均超越了DeepSeek- R1。
目前,QwQ-32B已在Hugging Face和ModelScope開源,並採用了Apache 2.0開源協議,用戶可以免費體驗其強大的推理能力。
在致力於開發下一代Qwen的過程中,阿里雲計劃將更強大的基礎模型與依託規模化計算資源的RL相結合,從而使其更接近實現人工通用智能。此外,阿里雲正積極探索將智能體與RL集成,以實現長時推理。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。