3月6日,阿里Qwen團隊正式發布他們最新的研究成果 —— QwQ-32B大語言模型!QwQ-32B在僅有DeepSeek-R1約1/20參數量的情況下, 用強化學習,實現了性能上的驚人跨越!
官方給出基準評測結果,涵蓋了數學推理、代碼能力和通用問題解決等多個方面。從數據中我們可以清晰地看到,在 AIME24 和 IFEval 等關鍵基準測試中,QwQ-32B 的表現甚至略微超過了參數量巨大的 DeepSeek-R1! 而在其他基準測試中,也基本與 DeepSeek-R1 持平,遠超其他對比模型。