智通財經APP獲悉,當地時間上週五(1月17日),OpenAI首席執行官山姆·奧特曼在社交媒體平臺X發文表示,OpenAI已完成其新推理AI模型o3 mini的版本,並將在幾周內推出。OpenAI去年12月底曾表示,至少在某些條件下,o3模型可以接近實現AGI(通用人工智能)。
2024年9月,OpenAI發佈了o1推理AI模型,該模型通過更長時間地處理查詢,能夠解決更爲複雜的問題。據介紹,o1模型能夠在科學、編程和數學等領域處理更具挑戰性的問題。與GPT等舊模型相比,o1模型不僅僅是一次簡單的升級,而是標誌着一個“完全不同的遊戲規則”和“真正的進步”。 OpenAI研究副總裁Mark Chen去年曾指出,o1與標準 ChatGPT 有着根本的不同,因爲它可以“推理”,這是人類智能的標誌。
隨着o1模型的推出,去年國內市場也湧現出一批新興的大模型,如kimi的k0math、幻方量化旗下Deepseek的DeepSeek-R1-Lite和崑崙萬維的“天工大模型4.0”o1版。月之暗面先後發佈數學模型k0-math、升級版視覺思考模型k1,在數理化等特定能力上表現優於o1。受成本降低和模型進化的推動,AI應用也開始湧現。ChatGPT式的AI對話助手成爲各家“標配”,包括字節豆包、月之暗面Kimi、騰訊元寶等。
即將發佈的o3和o3 mini模型將比o1系列更加強大。OpenAI的發言人此前表示,他們在給這款新模型命名時決定跳過o2,這是“出於對英國電信公司O2的尊重”。
據悉,o3模型在ARC-AGI基準上獲得了破紀錄的分數。ARC-AGI由Keras之父Fran ç ois Chollet開發,主要是通過圖形邏輯推理來測試模型的推理能力。以100%爲最高分的ARC-AGI評估結果顯示,在低計算場景中,o3得分爲75.7%,而在高計算測試中,它達到了87.5%。o3的最佳成績超過了標誌着達到人類水平的門檻85%。而目o1模型的得分僅在25%到32%之間。另外,在衡量編程能力的Codeforces Elo評分中,o3取得了2727的Elo評分,而o1評分僅爲1891。
國金證券認爲,展望未來,隨着大模型使用成本持續下降、中文語言模型能力繼續提升背景下,落地應用有望加速,中國企業有文化基礎、數據積累、場景理解、工程應用、客情關係等優勢,有機會形成自己的產業龍頭。
中信證券表示,觀察2025年全球科技市場投資,從市場維度,中國科技資產相對美國資產更具投資性價比。在中國科技板塊中,將中概互聯網板塊作爲首選,關注在短期宏觀復甦、政策刺激爲板塊帶來的業績拐點和中長期AI生態的持續繁榮爲板塊帶來的估值重塑機會,並看好中國國產AI產業鏈的投資機遇。
相關概念股:
百度集團-SW(09888):在模型側,目前文心大模型矩陣包括ERNIE 4.0 Turbo等旗艦大模型、ERNIE Speed等輕量模型,以及基於基礎模型生產的系列思考模型和場景模型。根據百度披露的數據,文心大模型日均調用量超15億,相較一年增長約30倍,用戶規模達到4.3億。在產品側,據官方數據,截至去年9月,文小言月活躍用戶達到千萬級別,累計調用量超過20億次。
阿里巴巴-SW(09988):阿里雲在去年5月初發布的通義千問2.5,得分就追平GPT-4 Turbo。目前,阿里已經投資了Minimax、月之暗面、零一萬物、智譜AI、百川智能等國內主流大模型創業公司。
商湯-W(00020):國內權威大模型測評機構SuperCLUE發佈《中文大模型基準測評2024年度報告》,商湯“日日新”融合大模型以總分68.3的優異成績,與 DeepSeek V3 一起並列國內榜首,成爲年度第一。在近期另一個權威綜合評測機構OpenCompass的多模態評測中,商湯以同一款模型同樣取得了榜單第一,分數大幅領先GPT-4o。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。