2月25日早間,阿里Qwen團隊在社交媒體宣佈發佈新推理模型——深度思考 (QwQ)。據介紹,該新推理模型基於Qwen2.5-Max的推理模型,目前的模型爲預覽版,已具有很強的數學理解、編碼、代理等能力,目前支持有深度思考(QWQ)和聯網搜索,同時佈局了多模態能力,能根據提示語句生成圖片。
阿里Qwen團隊還預告稱,在預覽版本以外即將發佈QwQ-Max 的正式版本,同步會發布Android和iOS應用程序,還會發布更小的可在本地設備部署的模型,如QWQ-32B等。
值得注意的是,在發佈該新功能的同時,通義千問團隊表示其獲得了qwen.ai域名,南都記者實測發現,用戶可以通過chat.qwen.ai訪問千問聊天。與DeepSeek類似,Qwen Chat的交互界面左下方有深度思考(QWQ)和聯網搜索兩個選項,點亮這兩個選項後,Qwen Chat就可以執行同DeepSeek一樣的功能,同時還可以根據自然語言提示創建圖像。
南都記者關注到,在近期由DeepSeek引發的深度思考模型熱潮中,不少廠商或選擇接入,或在接入的同時也推出自己的深度思考模型。其中,騰訊在接入DeepSeek以外,也於2月17日灰度測試騰訊自研的混元T1深度思考模型,同樣支持長推理和聯網搜索;百度則在其搜索首頁上線DeepSeek-R1滿血版支持聯網搜索。截至目前,阿里千問尚未接入DeepSeek。另外據媒體報道,字節跳動旗下Al助手豆包正在小範圍測試深度思考模型,但接入的不是DeepSeek模型。
阿里近來在AI領域動作不斷。2月24日,阿里巴巴集團CEO吳泳銘宣佈,未來三年,阿里將投入超過3800億元,用於建設雲和AI硬件基礎設施,總額超過去十年總和。這也創下了中國民營企業在雲和AI硬件基礎設施建設領域有史以來最大規模投資紀錄。
今年1月底,阿里發佈了AI基礎大模型千問旗艦版Qwen2.5-Max,在多項權威基準評測中,處於業界領先水平。目前,Qwen的全球衍生模型已突破9萬個,全球排名第一。除此以外,自2023年8月起,阿里雲相繼開源Qwen、Qwen1.5、Qwen2等多代模型,囊括了0.5B、1.5B、3B、7B、14B、32B、72B、110B等全尺寸,大語言、多模態、數學和代碼等全模態。根據全球最大AI開源社區Hugging Face顯示,截至目前,阿里千問(Qwen)開源大模型的衍生模型數量已突破10萬。
(文章來源:南方都市報)
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。