中國阿里雲發佈並開源全新推理模型通義千問QwQ-32B,稱性能比肩DeepSeek-R1

路透中文
10小時前
中國阿里雲發佈並開源全新推理模型通義千問QwQ-32B,稱性能比肩DeepSeek-R1

路透北京3月6日 - 中國互聯網巨頭--阿里巴巴9988.HKBABA.N旗下阿里雲週四發佈並開源全新的推理模型通義千問QwQ-32B;該公司並稱,通過大規模強化學習,千問QwQ-32B在數學、代碼及通用能力上實現質的飛躍,整體性能比肩DeepSeek-R1。

阿里雲在微信公衆號發佈的新聞稿指出,千問QwQ-32B還大幅降低了部署使用成本,在消費級顯卡上也能實現本地部署。在冷啓動基礎上,通義團隊針對數學和編程任務、通用能力分別進行了兩輪大規模強化學習,在32B的模型尺寸上獲得了令人驚喜的推理能力提升。

“在一系列權威基準測試中,千問QwQ-32B 模型表現異常出色,幾乎完全超越了OpenAI-o1-mini,比肩最強開源推理模型DeepSeek-R1。”阿里雲表示。

同時阿里雲採用寬鬆的Apache2.0協議,將千問QwQ-32B模型向全球開源,所有人都可免費下載及商用。

今年以來在中國人工智能(AI)初創公司DeepSeek橫空出世後,中國AI競爭的格局在快速重塑。上週阿里巴巴旗下AI創意作畫平臺--通義萬相團隊表示,將開源旗下視頻生成模型“萬相2.1”。

今年的中國政府工作報告亦再度將科技發展與創新置於“聚光燈”下。分析人士認爲,中國推進人工智能等發展有利於推動實現經濟增長目標;預計今年“AI+”將迅速落地並賦能千行萬業,同時各層級政府對於新質生產力、尤其是“AI+”方向的政策扶持力度預計會大幅增加。(完)

(發稿 王臻臻;審校 張喜良)

((Jenny.Wang@thomsonreuters.com;))

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10