在科技日新月異的今天,人工智能(AI)領域正經歷着一場前所未有的變革,而中國的科技公司正站在這場革命的最前沿,引領着全球AI技術的創新與發展。阿里巴巴、騰訊、快手、百度和字節跳動等中國互聯網巨頭,紛紛加大對人工智能的投資,認識到AI技術有可能徹底改變他們的業務,並保持其在全球市場的競爭力。
就在幾個月前,DeepSeek還是一家相對不爲人知的初創公司,但如今,它已迅速崛起爲老牌人工智能巨頭的強大挑戰者,標誌着許多人所說的中國“聊天技術時刻”。DeepSeek的崛起不僅重塑了全球人工智能行業的格局,也推動中國互聯網公司進入了一個創新和競爭的新時代。
DeepSeek:顛覆人工智能產業
DeepSeek,尤其是其推出的R1模型,在人工智能社區引起了軒然大波。這家初創公司的突然崛起,可歸因於幾個關鍵因素:
首先是成本效益。與西方同行相比,DeepSeek R1的開發成本只是其中的一小部分。該公司聲稱只花了600萬美元用於訓練模型的計算能力,遠遠低於ChatGPT或谷歌的Gemini等模型的估計成本。這使得DeepSeek在成本控制方面具有顯著優勢,能夠更高效地利用資源進行研發。
其次是性能卓越。儘管開發成本較低,但DeepSeek R1已經展示了令人印象深刻的功能。它在關鍵指標上可以與規模更大的競爭對手相媲美,甚至在某些方面超越了它們。這種出色的性能表現,使得DeepSeek R1在AI領域脫穎而出。
再者是定價策略。與OpenAI模型相比,DeepSeek提供的每個代幣的成本要低得多。這使得DeepSeek成爲開發人員和企業的經濟高效解決方案,降低了他們使用AI技術的門檻。
此外,DeepSeek還採取了開源方法。與許多專有模型不同,DeepSeek以相對開源的方式發佈了R1模型,允許研究人員和開發人員自由訪問和修改代碼。這種開源精神促進了AI技術的共享與創新,推動了整個行業的發展。
最後是效率優勢。DeepSeek R1採用混合專家(MoE)架構,每次向前傳遞6710億個參數,只激活370億個參數。這種設計確保了模型的可伸縮性,而不會按比例增加計算成本。這使得DeepSeek R1在處理大規模數據時更加高效,能夠滿足不同場景下的需求。
DeepSeek的出現產生了深遠的影響。它挑戰了開發尖端人工智能模型需要大量資源的觀念,促使全球重新評估人工智能發展戰略。同時,DeepSeek的成功也突顯了在限制條件下的創新潛力。儘管面臨美國芯片出口限制等挑戰,但DeepSeek仍然憑藉自身的努力和創新精神,開發出了具有世界領先水平的AI模型。
中國互聯網巨頭:加速人工智能投資
DeepSeek的突破引發了中國互聯網巨頭之間的人工智能軍備競賽。阿里巴巴、騰訊、快手、百度和字節跳動等公司紛紛加大對人工智能的投資力度,認識到AI技術有可能徹底改變他們的業務,並保持其在全球市場的競爭力。
阿里巴巴作爲中國電商領域的巨頭,一直在積極探索人工智能技術的應用。最新、最先進的大型語言模型(LLM)Qwen 2.5-Max就是其努力的成果。這個模型使用了像DeepSeek這樣的MoE架構,並且已經接受了超過20萬億個令牌的訓練。Qwen 2.5-Max在多個基準測試中表現出色,在各種測試中表現優於DeepSeek-V3、gpt-40和Llama-3.1-405B等型號。該模型有不同的尺寸,參數從30億個到720億個不等,包括基本版本和指令調整版本。Qwen 2.5-Max擅長語言理解、編碼、數學和推理,還具有多模式功能,允許它處理文本和視覺輸入。阿里巴巴通過其生成式人工智能開發平臺model Studio上的API使該模型可訪問,使全球開發人員能夠利用其功能。
此外,阿里巴巴還投資了人工智能初創公司Moonshot AI。Moonshot AI於2025年1月推出了其最新型號Kimi k1.5。這個多模態推理模型已經證明了與OpenAI的GPT-01相當的性能,特別是在數學任務上表現出色。Kimi k1.5具有128k令牌的擴展強化學習(RL)上下文窗口,並採用先進技術來增強RL策略優化。該模型在各種基準測試中顯示出令人印象深刻的結果,包括AIME得分77.5分和MATH 500得分96.2分。Kimi k1.5在多模態推理任務方面也表現出色,比如MathVista,這需要對幾何和智商測試等複雜科目進行視覺理解。Moonshot AI專注於長上下文處理和多模態推理,將Kimi k1.5定位爲不斷發展的人工智能領域中多功能和強大的工具。
騰訊作爲中國互聯網行業的另一巨頭,也在人工智能領域取得了顯著進展。其旗艦LLM渾源大是一個總參數3890億、激活參數520億的開源模型。渾源-large於2024年底發佈,採用先進的MoE架構,以7倍的激活參數實現相當於密集模型的性能。該模型在中文和英文語言處理方面都表現出了強大的能力,在許多關鍵基準測試中都優於Meta的Llama 3.1 405B。渾源-large可以處理多達256000個令牌的上下文,適合需要廣泛上下文和詳細分析的應用程序。騰訊已經在HuggingFace和GitHub等開發者友好型平臺上提供了該模型,鼓勵人工智能社區的廣泛採用和創新。
快手作爲短視頻領域的佼佼者,也在積極探索人工智能技術的應用。其領先的大型語言模型(LLM)(實際指AI模型)快意自推出以來取得了顯著的進步。截至2025年初,快意的整體性能已大大超過GPT-3.5,並在某些指標上接近GPT-4的能力。該模型在內容創建、信息諮詢、數學解題等方面表現出色,性能與ChatGPT基本相當。快意是快手綜合AI模型矩陣的一部分,該矩陣還包括推薦模型和視覺生成模型。快手最近還推出了“可靈”(Kling),這是一種文本到視頻的模型,可以生成長達兩分鐘的1080p分辨率的高質量視頻。快手的人工智能創新旨在重塑其內容創作和商業生態系統,爲用戶提供先進的視頻生成和創意表達工具。
百度作爲中國領先的搜索引擎公司,也在人工智能領域取得了重大進展。其憑藉Ernie大型語言模型(LLM)(實際指AI模型)繼續在AI領域深耕細作。百度計劃在2025年初發布新版本的Ernie,旨在提高其性能、準確性,並支持不同的用戶需求。截至2024年底,Ernie每天要處理令人印象深刻的15億個請求,每天處理超過1.7萬億的文本令牌,比前一年增長了30倍。百度首席執行官李彥宏預測,在各行各業快速部署生成式人工智能的推動下,到2025年人工智能應用將出現“指數級”增長。該公司還推出了新的人工智能工具,包括文本到圖像生成器I-RAG和無代碼應用程序構建器,作爲其人工智能技術商業化戰略的一部分。
字節跳動作爲短視頻和社交媒體領域的後起之秀,也在人工智能領域展現出了強大的實力。其於2025年1月發佈的豆寶1.5 pro代表了該公司人工智能能力的重大進步。該模型採用了稀疏的MoE架構,在激活參數增加7倍的情況下,實現了與密集模型相當的性能。豆寶1.5 pro在各種基準測試中表現出了令人印象深刻的結果,在知識、編碼、推理和中文處理方面超過了gpt-40和Claude 3.5 Sonnet等模型。該模型還具有“深度思考”模式,通過廣泛的強化學習技術增強其推理能力。字節跳動還爲豆寶引入了多模式功能,包括文本、圖像和音頻處理,以及即將推出的文本轉視頻功能。儘管擁有先進的功能,但字節跳動爲豆寶保持了具有競爭力的價格,使其廣泛適用於個人和企業。
對中國互聯網公司的啓示
中國企業人工智能模型的快速發展具有深遠的影響。首先,這些AI模型將使中國互聯網公司能夠爲其龐大的用戶羣提供更復雜、更個性化的服務。從改進的搜索功能到更有吸引力的社交媒體體驗,人工智能將改變用戶與數字平臺的互動方式,提升用戶體驗和滿意度。
其次,DeepSeek R1、Qwen2.5-VL等人工智能模型可以顯著提高運營效率。例如,阿里巴巴的模型可以通過改進產品推薦和簡化物流流程,徹底改變電子商務行業的運作模式。這將有助於降低運營成本,提高業務效率,增強企業的競爭力。
再者,這些人工智能模型的多模式功能爲醫療保健、金融和教育等行業帶來了無限可能性。中國互聯網公司可以利用這些技術開發出適合當地需求的創新解決方案,推動相關行業的數字化轉型和升級。
最後,隨着這些人工智能模型的不斷改進和完善,它們將使中國公司在全球市場上更有效地競爭。這可能會導致全球越來越多地採用中國的人工智能解決方案,提升中國在全球AI領域的地位和影響力。
值得注意的是,自ChatGPT於2022年11月推出以來,納斯達克100指數上漲了81.6%,而KraneShares CSI中國互聯網ETF(KWEB)同期僅上漲了17.5%。這表明,儘管中國互聯網公司在AI領域取得了顯著進展,但其市場估值仍有待進一步提升。我們認爲,對中國互聯網公司來說,DeepSeek的崛起可能成爲“聊天時代”的時刻,並可能導致這些公司的估值重估,更接近它們的美國同行。
結論
總之,DeepSeek的突破不僅展示了中國生產世界級人工智能模型的能力,還在中國科技領域掀起了新一輪的創新和投資浪潮。隨着阿里巴巴、騰訊、快手、百度和字節跳動等互聯網巨頭繼續推動人工智能技術的發展和創新,我們可以預期,在中國和全球範圍內,數字服務的交付和消費方式將發生革命性的變化。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。