中国阿里云发布并开源全新推理模型通义千问QwQ-32B,称性能比肩DeepSeek-R1

路透中文
10小时前
中国阿里云发布并开源全新推理模型通义千问QwQ-32B,称性能比肩DeepSeek-R1

路透北京3月6日 - 中国互联网巨头--阿里巴巴9988.HKBABA.N旗下阿里云周四发布并开源全新的推理模型通义千问QwQ-32B;该公司并称,通过大规模强化学习,千问QwQ-32B在数学、代码及通用能力上实现质的飞跃,整体性能比肩DeepSeek-R1。

阿里云在微信公众号发布的新闻稿指出,千问QwQ-32B还大幅降低了部署使用成本,在消费级显卡上也能实现本地部署。在冷启动基础上,通义团队针对数学和编程任务、通用能力分别进行了两轮大规模强化学习,在32B的模型尺寸上获得了令人惊喜的推理能力提升。

“在一系列权威基准测试中,千问QwQ-32B 模型表现异常出色,几乎完全超越了OpenAI-o1-mini,比肩最强开源推理模型DeepSeek-R1。”阿里云表示。

同时阿里云采用宽松的Apache2.0协议,将千问QwQ-32B模型向全球开源,所有人都可免费下载及商用。

今年以来在中国人工智能(AI)初创公司DeepSeek横空出世后,中国AI竞争的格局在快速重塑。上周阿里巴巴旗下AI创意作画平台--通义万相团队表示,将开源旗下视频生成模型“万相2.1”。

今年的中国政府工作报告亦再度将科技发展与创新置于“聚光灯”下。分析人士认为,中国推进人工智能等发展有利于推动实现经济增长目标;预计今年“AI+”将迅速落地并赋能千行万业,同时各层级政府对于新质生产力、尤其是“AI+”方向的政策扶持力度预计会大幅增加。(完)

(发稿 王臻臻;审校 张喜良)

((Jenny.Wang@thomsonreuters.com;))

免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。

热议股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10