文|數據猿
2024年逐漸遠去,新的一年悄然而至,回顧這一年,科技界和風險投資圈的目光無疑聚焦在了人工智能。層出不窮的新產品,鉅額的融資,獨角獸創始人不斷刷新人們的觀念,如同走馬燈般,你方唱罷我登場,而看客每天都在期待下一個大新聞。
誠然,2024年可以說是生成式人工智能大模型領域承前啓後之年,雖然未再現GPT-3和ChatGPT橫空出世的震撼,但在延續前幾年技術積澱的基礎上,開啓了廣泛應用的時代。從AI技術首次涉足諾貝爾獎評選,到Cursor作爲AI輔助編程的標杆工具徹底改變開發者的工作方式,再到Perplexity、Talkie等現象級AI應用打入大衆市場,以及Sora在多模態生成領域進一步接近自然和人類規律,生成式AI展示了從技術探索邁向實際應用的巨大勢能。
與此同時,算力仍然是推動技術進步的關鍵瓶頸,高昂的研發成本也隨之攀升。此外,技術幻覺問題以及隱私與倫理方面的挑戰依舊懸而未決。儘管大模型在技術上不斷取得進展,吊足了胃口的人類,已不再滿足於GPT o1的能力,而是期待通用人工智能(AGI)的世界馬上到來。與這一宏大願景形成對比的是,生成式AI的焦點正在逐步轉向小模型的高效化以及低能耗解決方案,以便更加深入廣泛的行業應用。另外,日益強化的行業監管和愈加激烈的市場競爭,也爲這一領域的發展增添了更多變數與挑戰。
接下來,讓我們回到2024年,共同回顧生成式AI在這一年中波瀾起伏的發展歷程。
技術持續突破永不停歇
在這一年中,生成式AI技術的前行步伐雖不如前幾年那般勢如破竹,但從深度到廣度的突破依然令人矚目。
接近年底時刻,2024年12月5日 - 21日,人工智能的頭號玩家OpenAI馬不停蹄地做了爲期12天的直播。最後1天,OpenAI重磅發佈新一代推理模型系列o3,其在極其困難的數學和邏輯問題能力基準測試ARC-AGI中,最佳狀態下取得了87.5%的分數,達到85%的分數即被認爲是“人類水平”,而在Codeforces競賽編程上的評分達到2727,也超越了大部分人類程序員。
2024年從o1preview到o3在Codeforces的評分進化,來源:ibb.co
去年,OpenAI還有兩個里程碑式的大模型發佈。一是最早於9月發佈的o1模型,代號“草莓”,儘管它的性能要低於後來發佈的o3模型,但其里程碑意義不容忽視。o1模型首次實現了在回答用戶提問時,形成類似人類思維方式的內部思維鏈CoT(Chain of Thought),這一突破顯著提升了模型在處理複雜和專業性問題時的表現,尤其是在研究、策略制定、編碼、數學和科學等領域的高難度任務中,回答的準確性和邏輯性得到了明顯改善。“思維鏈”這一概念也迅速走紅,成爲2024年大模型領域最常被提及的技術關鍵詞之一。
二是早在2月份就預先發布的Sora,十個月後正式發佈。它支持多種輸入方式,如文本、語音、圖片或視頻,據OpenAI介紹,Sora支持用戶生成最高1080p、最長20秒、多種尺寸比例的視頻,同時Sora能夠理解和模擬物理世界的運動規律,使得模型的生成效果更加逼真。此外,Sora還配備了故事板、混剪等編輯功能,相當於給視頻加分鏡、剪輯、特效,更能滿足創作者自我表達創意的需求。
OpenAI Sora,來源:OpenAI、beebom.com
隨着年初Sora的推出,多家科技公司爭相發佈新的多模態大模型,整個2024年讓我們見證了多模態大語言模型(MLLMs)的快速崛起。
2024年的多模態模型能夠更加自然地融合文本、圖像、音頻、視頻等多種模態的數據,生成高度準確的視覺內容。人們還把多模態延展到三維空間世界,李飛飛創辦的World Labs用一張圖、一句話就能生成3D世界的AI系統,堪稱“虛擬世界生成器”,該技術將降低3D內容製作的成本、激發更多的沉浸式體驗。
在運算效率方面,2024年的新一代多模態模型通過引入稀疏激活機制、模型壓縮和分佈式算力架構,大幅提升了處理速度和響應效率,與以往需要離線計算或長時間生成的模型相比,性能更爲出色。此外,這些模型突破了早期多模態技術對單一任務的限制,具備更強的上下文理解能力和任務適配性,能夠勝任更復雜的任務,例如根據一張照片生成完整的故事情節,或通過語音輸入實現圖像增強和視頻製作。這些進步讓多模態模型在影視及廣告行業的應用更爲廣泛,使其大幅提升內容創作效率、顯著降低製作成本成爲可能。
2024年,當AI各類大模型的不斷升級,巨量算力需求持續攀升。爲了滿足日益複雜的任務需求,進一步增強算力成爲推動大模型技術進步的核心動力。
提及算力必須要提到英偉達,去年其H100 GPU憑藉卓越的並行計算能力和顯著優化的AI訓練與推理速度,成爲生成式AI的核心處理器。去年3月,英偉達發佈了新一代GPU架構——Blackwell,該架構在訓練與推理方面展現出卓越性能,進一步鞏固了其行業領導地位。同時,谷歌的TPU和亞馬遜的Inferentia等專爲AI任務設計的定製芯片也在2024年加速普及,這些AI芯片亦推動了算力效率的持續提升,爲人工智能的深度應用提供了強大支持。
英偉達創始人黃仁勳展示Blackwell GB200 Superchips,來源:英偉達
與此同時,雲平臺則成爲AI算力的最佳載體,它不僅降低了企業和開發者使用高性能AI算力的門檻,還爲模型訓練、推理和部署提供了強大的基礎設施支撐。2024年,這一協同關係在技術和應用領域都實現了重要突破,如英偉達與多家雲服務商合作推出了“AI超級計算雲”。
雲計算服務模式也在不斷演變,模型即服務(MaaS)逐漸成爲一種新興的基礎服務,通過MaaS,用戶無需自行構建或訓練模型,即可直接通過API調用雲平臺託管的大模型。這種模式不僅讓原本未採用SaaS的用戶感受到雲計算的彈性和按需付費的優勢,降低開發者的技術門檻的同時,也推動了更多企業主動上雲,加速了雲計算與人工智能的融合與落地。
在2024年,針對大模型長期以來的“幻覺”(Hallucination)問題的緩解方法,業界亦達成了較爲明確的共識。“幻覺”是指模型在生成內容時出現的不準確或虛假的信息,成爲AIGC投入實際應用的最大障礙。當前,利用Agent和檢索增強生成(RAG)技術結合小模型和微調的方法,可以大幅降低“幻覺”的不良影響,讓結果達到需求方可接受的程度。
Agent架構讓大模型能夠分解複雜任務,逐步進行推理。與傳統的大模型“一步到位”給出答案不同,Agent的多步驟執行機制更接近人類的邏輯思維。例如,在回答涉及多個邏輯鏈條的複雜問題時,比如金融涉及時事和法律的問題,Agent可以分步調用小模型或外部工具驗證每一環節,減少幻覺的產生。
當用戶提出一個問題時,RAG機制讓大模型優先從知識庫中檢索相關文檔,這些知識庫可能來源於內部文檔,也可能是實時搜索獲取,然後基於這些可靠數據生成回答,從而顯著提升內容的準確性和可解釋性,同時有效降低大模型的訓練成本。此外,在有些特定領域,如醫學、教育,通過微調小模型,可大幅提升其在該領域的表現,不僅應對了大模型泛化能力強但特定領域表現不足的短板,亦使其更容易落地到應用場景,由此開啓了大模型企業級應用時代。
來源:Mhammed Talhaouy
應用爆發大放異彩
談及應用,2024年可謂是AI大模型應用全面爆發的一年。在這一年中,大模型不再只是科研論文中的技術突破,停留在ChatGPT 20美元訂閱費的體驗版,而是廣泛推向全球各個應用場景,成爲改變行業運作方式的推動力量。從辦公效率革命到精準醫療,從智能金融到數字人的直播體驗,人們開始利用大模型賦予各行業全新的生命力。
實際上,從2024年12月的AI排行榜可以看出,MAU(按月活躍用戶)排名靠前的AI應用主要還是集中在辦公效率工具領域,除了ChatGPT、Gemini和Claude等聊天機器人外,許多應用在辦公場景中亦表現突出。微軟Copilot作爲早期的樣板,推動了辦公工具在2024年的全面發展。文章寫作、PPT製作、繪圖、視頻創作、筆記和語法校正等功能,不僅能爲用戶節省大量時間,還能生成新穎、有創意的成果。不過此類應用的門檻相對較低,同質化競爭較爲激烈。同一種需求,市場上可能存在上百個類似產品,脫穎而出並不容易。
2024年12月全球AI產品榜(web端),來源:公衆號@AI產品榜 aicpb.com
此外,有些專業性較強的領域,像金融、法律、醫療和製造等行業,儘管存在一些具有針對性的AI應用,但即便在行業內部也鮮有應用,尚未實現廣泛的“破圈”。對於投入大量開發成本的企業負責人而言,儘管他們絞盡腦汁,嘗試爲自身行業需求定製“套殼”的AI解決方案,但這些應用往往未能達到預期的用戶量,更難以實現銷售轉化。
紅杉資本在《Generative AI’s Act o1》報告中肯定了AI在各專業場景中通過“Multi AI Agent”實現深度整合的未來趨勢,然而,這並非簡單的“新瓶裝舊酒”,而是對傳統數字化的顛覆性革新。與過去的任務編排模式相比,AI Agent正朝着完全自動化的方向邁進,減少甚至無需人工干預,背後應是對行業深度理解基礎之上的強大推理能力。紅杉的報告人表示,這個過程還在持續進化之中。
https://www.sequoiacap.com/article/generative-ais-act-o1/,來源:Sequoia Capital
值得注意的是,去年AI搜索引擎——作爲一個獨特的應用領域,其頭部企業在融資方面取得了顯著進展。其中,Perplexity AI在12月完成了5億美元的融資,使公司估值達到90億美元;此外,企業搜索初創公司Glean於9月宣佈完成超過2.6億美元的融資,估值翻倍至46億美元;甚至連OpenAI也於7月25日首次推出了搜索引擎產品SearchGPT。
成功背後的原因,我們認爲主要來自三大方面,第一是AI搜索依靠的技術已經取得了長足進步,正如前面提到的大模型、RAG以及算力,正讓搜索結果變得“簡單可依賴”;第二,搜索蘊含着巨大的市場,實際是在侵蝕現有搜索引擎的市場空間,AI搜索的前段邏輯是先給出結果,再給出對應的參考網站,這爲大量用戶節省了二次查找的時間,部分替代了原有搜索引擎的功能;第三,在Agent架構下提供專業領域的知識庫,能夠靈活地幫助用戶查找特定網站或特定專業領域的內容,而傳統搜索引擎配置信息源的成本比較高。
帶來更爲驚人變化的,還有廣告領域。美國數字營銷公司AppLovin轉型成爲AI公司後,股價已從年初的每股38.78美元一度飆升到最高每股417.64美元(2024年12月6日最高價),漲幅超過977%。生成式AI+動態預算優化是AppLovin AI的核心邏輯,從而能夠提高投資回報率和貨幣化機會。
具體來說,AppLovin首先採用生成式AI自動生成個性化廣告內容,接觸到大量的用戶,然後通過AI模型實時監測用戶獲取成本(CAC)和用戶生命週期價值(LTV)來動態調整廣告預算,形成一個持續優化的閉環,機器學習則幫助平臺逐步提升投放效率並降低成本。同時,AppLovin採用多AI Agent協同架構,將複雜的廣告運營流程分解爲創意生成、行爲預測、競價優化和效果分析等獨立的Agent協作運行,如此進一步提升平臺的靈活性和效率。
Applovin機制,來源:https://www.linkedin.com/pulse/applovin-app-hyoungjun-kang-tjthe/
比Applovin更加迅速崛起的2024年現象級應用,Cursor無疑是最值得關注的一匹黑馬。這家基於提示詞自動生成應用程序的AI應用公司在去年8月份之前還默默無聞,8月a16z和Thrive Capital給Cursor的投資到位,估值4億美元,到年底的B輪融資,估值高達26億美元,12個工程師讓公司估值上漲了6.5倍,如今已經成爲百萬程序員的必備神器,靠每月20美元的訂閱費,讓經常性年收入達到1億美元。
不只是改變程序員,Cursor重大意義更在於工作方式的變革。在Cursor的世界裏流傳着一段傳奇故事是一位8歲的小女孩利用Cursor在45分鐘內就構建了一個聊天機器人,技術對普通人的神奇改變猶如當年的“別針換別墅”;同樣不會編程的產品經理陳雲飛花了1小時寫了一個名爲“小貓補光燈”的APP,然後發佈在了蘋果APP Store,一度在收費榜中排名第一。著名人工智能專家、Coursera創辦人吳恩達認爲懂AI的產品經理將在未來的市場中佔據更爲重要的位置,AI讓開發門檻降低,而對能夠明確“構建什麼”的人才需求將大幅上升。
另外值得一提的是2024年獲得巨大發展的中國AI出海應用。根據SensorTower發佈的2024年上半年美國AI應用市場的下載量數據顯示,排名前十的AI應用中有三款來自中國企業。其中,MiniMax的陪伴式應用Talkie在美國下載量排名第四,超越了美國同類產品領頭羊Character.ai。MiniMax的另一款AI視頻應用海螺(Hailuo)亦曾在9月登頂全球及國內增速榜首,而在教育領域,Question.AI和Gauth更是雙雙領跑美國市場,成爲行業標杆。
最近幾年,中國科技企業在全球化的運營經驗越來越成熟,善於根據目標市場的文化特點和用戶習慣調整產品,而且中國出海的AI應用通常採用更高性價比的服務策略,例如,通過低門檻的訂閱費或免費增值模式吸引大量用戶,隨後再利用豐富的功能層層加深用戶粘性。
來源:talkie
我們再來說說AI硬件,2024年也被視爲AI硬件的創新大年。各類硬件設備——從手機、PC、汽車、耳機、眼鏡甚至玩具——紛紛融入AI技術,儘管這些AI硬件還未全面滲透到消費者的日常生活,但通過AI技術的加持,已經增強了原有產品的用戶體驗。
蘋果和Google推出的AI手機成爲這一年行業的標誌性事件。前者推出了集成Apple Intelligence的大模型生態系統,將AI深度融入iPhone 16系列手機;後者則在其Pixel系列中強化了多模態交互功能,國產手機廠商也紛紛佈局這一領域。此前根據賽迪顧問預測,2024年新型AI手機的出貨量預計將會達到1.5億部,佔全球智能手機總出貨量的13%。
AI手機各廠商的目標遠不止類Siri的升級版或是簡單接入大模型,2024年流行的一個名詞“端側AI(On-device AI或Edge AI)”是指在本地設備(如手機、平板、智能手錶、智能音箱等終端設備)上運行人工智能模型,而不需要將數據傳輸到雲端進行計算。這樣做的好處,除了實時響應與增強體驗以外,還可以藉助App Intents和App Entities,實現互聯互通,調起更多的APP。
儘管不需要特定的手機硬件支持,智譜AutoGLM藉助上述理念展現了更爲強大的AI助手引起了用戶的廣泛共鳴,比如用戶可以用語音向安裝了AutoGLM的手機提問,“幫我上小紅書看看火鍋需要什麼食材”,於是AI智能體上小紅書筆記裏幫用戶去尋找火鍋食材,並在“到家App”上自動將上述食材多步驟操作加入購物車並下單。而未來具有端側AI功能、搭載AI加速芯片的手機將會適配支持更復雜任務交由本地化處理。
作爲人工智能與機器人產業交匯處的具身智能(Embodied AI),在2024年悄然取得進步。頻繁亮相的特斯拉Optimus機器人去年在運動控制和任務執行方面展現出強大的迭代速度,在運動控制、任務執行、學習能力等方面不斷提升水平,業已被特斯拉引入自家的汽車生產線測試。同樣,搭載了視覺語言模型(VLM)、能夠進行常識性推理,並能與人類進行有效溝通的Figure AI人形機器人Figure 02,也於去年11月正式進入汽車巨頭寶馬的生產線打工。
Tesla Optimus在操作物體時也具備交流能力,來源:特斯拉
各大車企加速佈局人形機器人以外,工業巡檢、倉儲物流、醫療輔助、建築與施工、家政服務等領域都在成爲具身智能的落地場景。例如Google DeepMind推出的RT-2模型,通過視覺-語言-動作(VLA)模型,將多模態大模型塞進機械臂,使推理與知識賦能給機器人,既能用在家政行業,執行烘焙、清理和準備食材等任務,也能運用在自動化生產線,讓我們看到通用機器人的可能性。
而2024年備受關注的世界模型(WFMs)概念,爲具身智能的訓練與測試開闢了全新範式。機器人能夠在虛擬的小世界中進行“試錯”和“練習”,從而具備“腦補”的能力,即提前模擬和預測自身動作的結果。這種能力支持具身智能體實現自主決策與持續學習,讓機器人從傳統的“被動執行”邁向“主動進化”,此被視爲邁向通用人工智能(AGI)的重要一步。
你方唱罷我登場的企業競爭格局
2024年,大模型已不再是OpenAI的一枝獨秀。如果說2023年以Claude和Llama爲代表的挑戰者只是星星之火,而在2024年挑戰OpenAI的大模型已經燎原。例如,DeepSeek v3模型以僅557萬美元的訓練成本實現了與Claude 3.5 Sonnet等頂級模型相媲美的性能,顯著降低了高性能AI的進入門檻。同時,Meta推出的Llama 3.1和Llama 3.2開源模型在多模態能力上取得重大突破,在圖像、音頻和文本處理方面更加高效。
我們查看了包括Open LLM Leaderboard、LiveBench AI、MMLU、Chatbot Arena、SuperClue、Lmarena AI在內的多家大模型測評網站,儘管大部分OpenAI旗下的大模型仍居榜首,不過有些靠前位置則被Claude和Gemini取代。根據Menlo Ventures的調查報告,Claude的市場份額從12%翻番到24%,Google從7%提升到12%,而OpenAI的市場份額則從去年同期的50%下降至 34%。
2023和2024年各主要大模型公司市場份額對比,來源:Menlo Ventures
我們先來說說Claude,這個大模型的母公司Anthropic是由OpenAI的前核心團隊成員於2021年創立,到2024年也不過3年時間。之所以獨立出來創業,創始團隊認爲,隨着大模型越來越強大,AI的不可預測性和安全風險也在增加,因此他們提出了“憲法AI(Constitutional AI)”的理念,強調通過內置規則和透明的設計來減少模型的有害輸出。
安全性貌似與普通人無關,不過我們從大模型幻覺角度考慮就容易理解一些,更嚴格的標準不會讓大模型胡說八道,而且,對於金融、醫療和法律等對數據安全與準確性要求高的行業,可靠性與穩定性顯得尤爲重要,讓其成爲企業市場的熱門選擇。前面提到的當紅辣子雞Cursor,去年毅然將其AI編程助手的默認模型也從GPT換成了Claude。
受到企業級用戶青睞,加上Claude 3.5本身的技術實力,其流量在2024年實現了爆發式增長,從1月的2019萬攀升至11月的8932萬,增幅高達342%。這一成績亦與Anthropic的市場策略密切相關,Claude憑藉高性能和靈活架構,成爲企業整合AI技術的首選方案之一,同時通過相對低價和良好的企業適配性佔據市場優勢。據彭博社報道,2024年美國AI初創企業融資達970億美元,佔全年初創融資總額的近一半,創歷史新高,Anthropic抓住這一良機,大幅擴充銷售團隊規模,從2023年的200餘名增長至去年9月的1000餘名,同比增長500%,加速向市場滲透。因此,許多中小企業在2024年從開源或其他大模型轉移到Claude作爲其生成式AI能力的底層支持。
我們再來看Gemini。Gemini的發展要放在Google的大格局裏看。儘管此前有Bert大模型,但2022年底Google並沒有跟上Transformer的浪潮,換句話說,Google落後了,不僅落後於微軟,也落後於Meta。而2024年,是Google在AI領域奮起直追的一年。
首先Google想到用AI能力最強的DeepMind的團隊,我們都知道DeepMind最成功的作品是阿爾法狗(AlphaGo),儘管過去很多年,實力還在,今年諾貝爾化學獎的兩位得主就出自DeepMind,其中一個還是DeepMind的聯合創始人兼CEO。
Google打破部門間的藩籬,將Gemini的主導權交給DeepMind,谷歌首席執行官Sundar Pichai稱,此次重組旨在不斷加快谷歌人工智能開發的步伐。此次重組效果是明顯的,Gemini因此能夠融合深度學習、神經網絡和生成對抗網絡(GAN)等多種先進的AI技術,使其具備更強的自我學習能力和生成能力。
我們看到去年全面升級後的Gemini 2.0,以多模態爲發力點,使其能夠處理文本、圖像、音頻和視頻等多種輸入來源,具備全面的感知與理解能力,進一步接近人類對物理世界的認知。而Gemini 2.0強調的定位——“Our new AI model for the agentic era”,通過多模態的強大能力突破了單一任務的限制,更可能達到智能代理所需的“全面感知 + 自主決策”。
Gemini的信心還源於Google尤其是雲服務的強力支持。在電商衝擊廣告業務、搜索面臨Perplexity圍追堵截之時,Google比以往任何時候都更加重視AI的推動作用。2024年,Google Cloud以Gemini 2.0爲核心,整合旗下AI模型與組件,對Vertex AI平臺進行升級,並與其生態系統(如Workspace)實現無縫銜接,旨在吸引更多的企業客戶,從需求側深度綁定谷歌雲服務,助力其在雲計算和AI應用領域佔據更大的市場份額。
Google Cloud 12月在深圳的發佈會現場,來源:數據猿陸易斯
AI的價值之所以能在雲層面得以承載,是因爲雲平臺提供了一個強大的、可擴展的環境,讓企業能夠以較低的門檻快速開發、部署並運行AI應用。除Google 外,2024年亞馬遜AWS和微軟Azure也在雲平臺上深度佈局AI,以爭奪市場份額。
亞馬遜AWS在2024年的re:Invent大會上推出了一系列新技術,包括Amazon Nova基礎模型和Amazon Bedrock的重大升級。Bedrock則新增超過100款AI模型,並引入多代理合作和安全防護機制,以優化推理場景的準確性和成本。AWS還強化了其生成式AI助理Amazon Q,使其更深入地應用於軟件開發和商業場景。
微軟不只與OpenAI保持整合,在Microsoft Ignite 2024全球開發者大會上,微軟宣佈,已經建立了全球規模最大的企業級AI解決方案生態系統,用戶可以通過Azure AI目錄訪問超過1800個AI模型,企業可根據自身需要構建AI智能體。微軟表示,自推出以來,已有超過10萬家組織用Copilot Studio創建了自身的AI智能體。
國內的通義千問(阿里巴巴)和豆包(火山引擎,字節跳動)同樣體現了大模型與雲計算深度綁定的發展策略。
阿里巴巴依託其強大的阿里雲生態,充分整合了旗下大模型通義千問的能力。通過阿里雲,通義千問能夠爲企業提供定製化的行業解決方案,如電商推薦、客戶服務、內容創作等,從而吸引更多的企業客戶上雲。火山引擎則利用豆包大模型,提供諸如廣告優化、內容生成、視頻編輯等高度垂直的服務,與字節跳動的內容生態如抖音、今日頭條等平臺以及工具鏈如創作工具剪映高度協同。
來源:艾瑞
由此我們可以看出,儘管中美的科技巨頭在產業結構上採取了相似的路徑,但中國企業更加註重內部生態的整合。對於國內頭部企業而言,走過了“百模”大戰的2024年是圍繞大模型生態進行佈局和競爭的一年,不論是C端還是B端市場,都涵蓋在內。對於中國消費者而言,他們並非侷限於某一特定生態,而是通過對比各家產品功能,力求獲得最佳性價比。
我們以字節跳動的AI佈局爲例。首先,2023年11月,字節成立Flow部門,專注於AI模型的技術開發與應用,共分爲三層,Stone團隊承擔產品研發支持職能;Seed團隊主攻大模型研發;Flow團隊則聚焦AI產品應用開發。其中,作爲底座的豆包大模型以“豆包通用模型PRo”、“視覺理解模型”、“語音合成模型”爲主打分別對應文本、視頻和音頻,其研發水平的提升通過評測的方法不斷對比國際同類大模型,而其中又根據不同細分場景,再切出來幾十種特定模型,如聲音復刻模型、角色扮演模型,適配各類場景應用;而更底層的火山引擎則提供底層算力和雲計算基礎。
然後,字節沿用國內APP矩陣的做法,開發一系列的AI產品,並非只單做國內市場,而是採取海內外同步推進的戰略,多場景全方位對標國際產品。比如豆包對應ChatGPT,虛擬陪伴貓箱對標Character AI、智能體開發平臺Coze對應Dify、AI編程工具Marscode對標Cursor;這裏也包括一些硬件產品,比如AI耳機“Ola Friend”、AI玩具“顯眼包”。
字節跳動旗下AI應用/硬件,來源:第一財經雜誌官方百家號、海通國際
與此同時,字節還將AI整合進現有產品線,提升現有產品的流量、回訪率和復購率等,例如爲抖音和Tiktok提供“即創”工具平臺,提供包括數字人、直播腳本在內的創作工具;爲剪映提供“即夢”文生圖、文生視頻工具;爲大力教育提供豆包愛學等等。
另外,不容忽視的是字節以“更低價格”與“更易落地”的策略搶佔市場先機。2024年5月,豆包大模型剛發佈的時候,主力模型在企業市場的定價只有0.0008元/千Tokens,0.8釐就能處理1500多個漢字,比行業便宜99.3%,如此比其他競品贏得了更多的客戶。
算力採購價格是影響大模型最終價格的核心因素,儘管國產芯片逐漸加碼,國內廠商對英偉達仍有巨大的採購需求。根據科技顧問機構Omdia數據,字節跳動和騰訊2024年分別訂購了約23萬片英偉達的芯片,其中包括Hopper架構下的低版本芯片H20,在Hopper架構的總購買數量僅次於微軟。
來源:Omdia
在算力領域,英偉達憑藉其領先的技術和生態系統,始終佔據行業主導地位。根據Trendforce和Digitimes,單看搭載GPU的AI服務器,英偉達市佔率逼近9成,其主要競爭對手AMD市佔率則僅約8%。去年10月,AMD發佈了MI325系列數據中心加速器,與英偉達依然有顯著差距,其管理層表示,與目前正在擴大規模的英偉達Blackwell的競爭可能不那麼順利。從收入的表現來看也是如此,AMD的收入增長並不像英偉達那麼明顯。
來源:wright's research
靠追趕是很難撼動行業主導者地位的,但下一代技術未必。2024年12月10日,谷歌推出Willow芯片,攜帶105個物理量子比特,能夠在短短不到五分鐘的時間,完成了當今最快的超級計算機Frontier需要10²⁵年才能完成的一個基準測試任務。這將爲人工智能的發展提供全新範式的想象空間。
這一年,人工智能帶給我們不同層面的想象空間還有很多,當OpenAI GPT3打開了潘多拉的盒子,2024則是人工智能邁向全新高度的一年。從生成式大模型的技術持續突破,到多模態模型應用的全面爆發,再到AI驅動行業變革的深度滲透,AI的影響力已經無處不在。然而,這一年也讓我們意識到,算力、幻覺、成本、倫理和監管等問題依然是未來發展的重要挑戰。
儘管通用人工智能(AGI)的宏大願景仍需時間來實現,2024年讓我們看到了人工智能從“前沿探索”逐步走向“實際落地”的巨大潛力。小模型的高效化、多模態模型的自然化、Agent架構的智能化,以及各行業的廣泛應用,特別是與雲生態的全面銜接,都表明人工智能已不再是遠離生活的科技,而是深刻改變社會經濟格局的重要力量。
展望未來,人工智能的道路依然波瀾壯闊。隨着更先進的技術、更高效的模型、更強大的算力和更健全的行業生態的逐步形成,人工智能的奇蹟將繼續書寫。而我們每個人,也將在這場浩大的技術浪潮中,成爲親歷者、見證者,甚至是推動者。波瀾壯闊的2024年,將爲人工智能的未來埋下無數可能的種子。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。