2月25日早间,阿里Qwen团队在社交媒体宣布发布新推理模型——深度思考 (QwQ)。据介绍,该新推理模型基于Qwen2.5-Max的推理模型,目前的模型为预览版,已具有很强的数学理解、编码、代理等能力,目前支持有深度思考(QWQ)和联网搜索,同时布局了多模态能力,能根据提示语句生成图片。
阿里Qwen团队还预告称,在预览版本以外即将发布QwQ-Max 的正式版本,同步会发布Android和iOS应用程序,还会发布更小的可在本地设备部署的模型,如QWQ-32B等。
值得注意的是,在发布该新功能的同时,通义千问团队表示其获得了qwen.ai域名,南都记者实测发现,用户可以通过chat.qwen.ai访问千问聊天。与DeepSeek类似,Qwen Chat的交互界面左下方有深度思考(QWQ)和联网搜索两个选项,点亮这两个选项后,Qwen Chat就可以执行同DeepSeek一样的功能,同时还可以根据自然语言提示创建图像。
南都记者关注到,在近期由DeepSeek引发的深度思考模型热潮中,不少厂商或选择接入,或在接入的同时也推出自己的深度思考模型。其中,腾讯在接入DeepSeek以外,也于2月17日灰度测试腾讯自研的混元T1深度思考模型,同样支持长推理和联网搜索;百度则在其搜索首页上线DeepSeek-R1满血版支持联网搜索。截至目前,阿里千问尚未接入DeepSeek。另外据媒体报道,字节跳动旗下Al助手豆包正在小范围测试深度思考模型,但接入的不是DeepSeek模型。
阿里近来在AI领域动作不断。2月24日,阿里巴巴集团CEO吴泳铭宣布,未来三年,阿里将投入超过3800亿元,用于建设云和AI硬件基础设施,总额超过去十年总和。这也创下了中国民营企业在云和AI硬件基础设施建设领域有史以来最大规模投资纪录。
今年1月底,阿里发布了AI基础大模型千问旗舰版Qwen2.5-Max,在多项权威基准评测中,处于业界领先水平。目前,Qwen的全球衍生模型已突破9万个,全球排名第一。除此以外,自2023年8月起,阿里云相继开源Qwen、Qwen1.5、Qwen2等多代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大语言、多模态、数学和代码等全模态。根据全球最大AI开源社区Hugging Face显示,截至目前,阿里千问(Qwen)开源大模型的衍生模型数量已突破10万。
(文章来源:南方都市报)
Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.