阿里发布深度思考模型预览版,可联网搜索、推理和生成图片

南方都市报
02-25

  2月25日早间,阿里Qwen团队在社交媒体宣布发布新推理模型——深度思考 (QwQ)。据介绍,该新推理模型基于Qwen2.5-Max的推理模型,目前的模型为预览版,已具有很强的数学理解、编码、代理等能力,目前支持有深度思考(QWQ)和联网搜索,同时布局了多模态能力,能根据提示语句生成图片。

  阿里Qwen团队还预告称,在预览版本以外即将发布QwQ-Max 的正式版本,同步会发布Android和iOS应用程序,还会发布更小的可在本地设备部署的模型,如QWQ-32B等。

  值得注意的是,在发布该新功能的同时,通义千问团队表示其获得了qwen.ai域名,南都记者实测发现,用户可以通过chat.qwen.ai访问千问聊天。与DeepSeek类似,Qwen Chat的交互界面左下方有深度思考(QWQ)和联网搜索两个选项,点亮这两个选项后,Qwen Chat就可以执行同DeepSeek一样的功能,同时还可以根据自然语言提示创建图像。

  南都记者关注到,在近期由DeepSeek引发的深度思考模型热潮中,不少厂商或选择接入,或在接入的同时也推出自己的深度思考模型。其中,腾讯在接入DeepSeek以外,也于2月17日灰度测试腾讯自研的混元T1深度思考模型,同样支持长推理和联网搜索;百度则在其搜索首页上线DeepSeek-R1满血版支持联网搜索。截至目前,阿里千问尚未接入DeepSeek。另外据媒体报道,字节跳动旗下Al助手豆包正在小范围测试深度思考模型,但接入的不是DeepSeek模型。

  阿里近来在AI领域动作不断。2月24日,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和。这也创下了中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。

  今年1月底,阿里发布了AI基础大模型千问旗舰版Qwen2.5-Max,在多项权威基准评测中,处于业界领先水平。目前,Qwen的全球衍生模型已突破9万个,全球排名第一。除此以外,自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2等多代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。根据全球最大AI开源社区Hugging Face显示,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万。

(文章来源:南方都市报)

免责声明:投资有风险,本文并非投资建议,以上内容不应被视为任何金融产品的购买或出售要约、建议或邀请,作者或其他用户的任何相关讨论、评论或帖子也不应被视为此类内容。本文仅供一般参考,不考虑您的个人投资目标、财务状况或需求。TTM对信息的准确性和完整性不承担任何责任或保证,投资者应自行研究并在投资前寻求专业建议。

热议股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10