在最新一期泰客Talk《Deepseek的真相和謊言》中,基金經理於騰達和券商分析師童飛分享了關於Deepseek對二級市場投資的影響的觀點。乾貨滿滿,整理如下——
精選內容——
在科技行業裏面永遠是隻要你有斷崖的領先優勢,你就會收割這個行業裏面絕大部分的利潤。
我覺得開源和閉源是路線之爭,但是也在動態的變化。
我們不得不承認就是DC它目前爲止還不是世界上性能最好的模型。
蒸汽機發現之後,大家對煤炭的使用量是上升的,就是大家會爲了搶佔模型的最高點,依然會保持算力的輸出。
我們訓練需求減少,但是推理需求其實是一直是存在的,今年2025年是推理大時代。
推理需求的上漲是否一定意味着英偉達的推理需求的上漲?
我們人腦的功率是10~30瓦,但是一塊a系列的芯片都要700瓦的一個功率了,那麼人腦用這麼低的功率就完成了我們這麼多豐富的研究成果,所以很多時候可能算法上的巧思也很重要。
Deepseek做的是一件科學的工作,但是投資不只是一件科學的數據性的工作。
問:達哥春節期間發了個朋友圈“如果說AI之前,底層科技萬古長夜,那這次,Deepseek讓科技樹點在了東方”,請達哥展開聊聊
於騰達:我從業以來大部分的時間的全球科技發展,都是應用科學,很少有底層科學的進步,像蘋果iPhone產業鏈它其實只是製造工藝的提升,包括光伏新能源車,也是製造工藝應用科學。大模型的出現,讓我們感覺到了底層科技發生了變化。
推動產業進步的或推動經濟社會進步的兩個重要元素,一個是生產要素,一個是生產效率。生產要素的變化大家是很容易捕捉到的,但是生產效率的提升,我認爲在過去這麼多年,大模型是第一次把底層的效率提升了一個非常大的臺階。
爲什麼說Deepseek讓科技樹點在了東方?我們之前做AI產業的投資,尤其是北美科技巨頭。在這個過程中我們會深刻地感受到整個產業鏈主要的環節是在海外。但這一次模型讓我們很驚喜。它快速的拉平了我們跟北美大模型的差距,用這麼低的算力水平達到了這樣好的效果。這個事件讓我想到去年9月份的時候,我們發射東風導彈,這兩個事件是同樣重要的。
問:聽說最近關於deepseek路演非常火爆,能否分享一下,基金經理最關注哪幾個問題?
童飛:基金經理主要從應用和算力兩方面關注DeepSeek。
首先,DeepSeek的R1和V1模型參數量雖小但是性能卓越,前一段時間英偉達股價下跌也與市場擔心算力需求減少有關。但另一方面,單個模型所需算力的減少導致模型的成本下降,反過來有機會推動AI應用的普及。
因此,一方面基金經理關注推理算力的需求量如何增長,另一方面關注DeepSeek是否能夠帶動大模型應用的大範圍落地,以及能否改變中國軟件企業商業模式。中國的許多軟件企業以項目製爲主,很多信息化項目主要是基於客戶的業務流程進行建設,而AI應用如果真的能夠落地,那麼中國的軟件企業將能夠爲行業客戶帶來增量價值,模型參數量減小也給了中小企業自行開發模型的機會。
此外,基金經理還關注DeepSeek現在最需要什麼,產業上有哪些上市公司能夠爲DeepSeek提供,這其中可能有一定的投資機會。
問:首先,科普一些關於deepseek的名詞解釋,什麼是強化學習(RL)?什麼是推理?可否簡單舉例說明deepseek的推理原理?什麼是蒸餾?可否簡單舉例說明?
童飛:先解釋下強化學習:傳統的機器學習都是根據歷史數據訓練,強化學習則是“幹中學”,典型的強化學習就是圍棋,使用強化學習,AlphaGo Zero能夠從頭開始學習圍棋遊戲。通過與自己對戰來學習。經過 40 天的自我訓練,Alpha Go Zero就能夠打敗Alpha Go。
推理在AI大模型中有兩種語境。一種是算力語境下的推理,就是大模型訓練之後進行應用。而在講大模型的推理能力時,其實就是人們一般語境下的推理,也就是DeepSeek有了似人的思考能力。DeepSeek能夠實現推理能力,主要依靠思維鏈(COT)。思維鏈簡言之就是讓大模型不直接輸出答案,而是輸出思考過程,通過一步一步的思考,最終得到答案。
蒸餾是一種AI模型壓縮技術,蒸餾簡單來講就是用小模型(學生模型)學習模仿大模型(教師模型)。小模型的性能可能會下降,但勝在運行成本低、反應快,這樣就能部署在邊緣端,比如汽車、手機、電腦等設備上。一般在蒸餾時,學生模型是由正常訓練得來的,只是使用的是教師模型的知識。最簡單直接的方法是給一個問題,教師模型會給出輸出,那麼這對輸入輸出就作爲學生模型的訓練樣本。除了這種方法,學生模型在訓練時還可以引入教師模型在面對輸入問題時的中間層信息,以更好地學習教師模型。
問:在名詞解釋的基礎上,請爲我們簡單科普一下deepseek發佈的兩款大模型R1-Zero和DeepSeek-R1,分別取得了怎樣的突破和創新?
童飛:R1-Zero這個模型有幾個非常顯著的特點:
首先,它是純強化學習路徑訓練的大模型, 證明純RL(強化學習)路徑可賦予大模型強大的邏輯推理能力。這個模型沒有經過傳統的監督微調(SFT)步驟,而是直接在V3基座模型上,利用GRPO(Group Relative Policy Optimization)算法進行了訓練。這一點在學術界和工業界都是非常創新的。
其次,R1-Zero引入了一種“組內競爭”的機制。舉個例子,它會生成多種解法,比如5種,然後從中篩選出最優的解法。這樣的做法不僅提高了推理的效率,還大大減少了對標註數據的依賴性。這一點對於提升模型的性能和降低成本都是非常有幫助的。
R1模型有幾個關鍵的技術進步:
首先,它也利用強化學習顯著增強了模型的推理能力。在這個過程中,我們看到了對監督微調(SFT)數據的依賴有所減少。
其次,該模型還推廣了模型蒸餾的方法。這意味着開發者可以將R1模型的推理能力轉移到更小型的模型上,這樣就能更好地適應特定應用場景的需求。
此外,R1模型還引入了冷啓動微調的概念,這涉及到使用少量的人工引導數據來初始化模型。
問:客觀評述,Deepseek的能力到底如何?有研報認爲,DeepSeek-R1在推理任務上基本實現與OpenAI-o1相當的性能,較o3模型仍有差距,是這樣嗎?爲什麼大模型都數不清strawberry裏有幾個r?
童飛:在AIME 2024、Codeforce、GPQA Diamond等多項國際標準測試中,R1分數與o1相近,基本上略好於o1,但和o3還有差距。
爲什麼大型模型難以準確計數單詞中的特定字母“r”,以下是可能的幾個原因:
首先,是分詞(Tokenization)相關的問題。一些大模型在處理文本時,會將單詞分解成多個token。比如說,“strawberry”這個單詞被分解成“Str-aw-berry”三個token,每個部分被模型視爲獨立的單元。這種分詞方法可能導致模型難以把握整個單詞的結構,因此無法準確識別出單詞中間的“r”。
其次,模型缺乏自我知識。如果告訴大模型將“Strawberry”這個單詞的每個字母列出來,刪除除了“r”之外的所有字母,模型就能正確計數。對此,AI+教育領域的專家Karpathy表示,這是因爲沒有人教模型如何去執行這樣的任務。
第三個原因是模型設計的侷限性。如果在提示(Prompt)中加入“think step by step”或者其他與思維鏈相關的提示,大型模型就能夠給出正確的答案。有觀點猜測,大模型的設計可能就是爲了讓它在解決問題時儘可能少地花費時間,除非我們有明確的指示,否則它不會主動進行深入的思考。
最後,Karpathy還提到了“Jagged Intelligence”現象,也就是說大型模型在不同的領域表現出不同的智能水平。這意味着模型在某些領域可能表現得非常出色,但在其他領域則可能表現不佳。
問:爲什麼openAI不開源?
童飛:這個裏面肯定是有一段故事的,最早它的名字叫openAI,是有開源特性的。但之後爲什麼沒有開源?openAI的chatGPT研發過程當中,也一度經歷過資金的短缺,投資方爲了未來的商業化,可能公司在開源和閉源上做了一些質的轉變。所以它就是一個閉源的模型。但是我們也看到Deepseek出來之後,openAI迅速開源了它的一些先進的模型。開源和閉源是路線之爭,但是也在動態的變化。
問:Deepseek爲什麼在中文互聯網如此出圈?有沒有哪些新聞傳播點其實是誤解?
於騰達:我覺得更重要的原因是它“飛入尋常百姓家”,觸達了最廣大的消費者。一個產品它如果要實現真正的經濟效應的話,它最廣大的技術是 ToC的。一旦ToC的,中文環境的人口是全球幾乎是最大的,它最大的價值就是在於讓AI的使用變得普惠了起來。
童飛:Deepseek登上了全球160多個國家的下載榜的榜首,它不光是在中國爆火,它在全球爆火,特別是我們春節期間,海外各種社交媒體上,對於Deepseek的討論非常多,甚至新任的美國總統川普都對Deepseek做了點評,這些推動了Deepseek的關注迅速升溫。
問:有沒有哪些新聞傳播點其實是誤解?
於騰達:有一些新聞說幻方是一家小公司。不能說幻方是一個小的創業公司,幻方是國內最早的一批而且是很強的量化金融公司。它在不管是之前做量化還是其他技術,他的目標是很清晰的,務實性也很強。
可能最近大家關注度上來之後,大家會去看他團隊,其實幻方不管是他的核心團隊成員,還是他的一些招的員工,有一個很高的要求,必須是當年的高中奧賽的選手,比如說你高考的時候數學或物理考了滿分,可能是因爲這份試卷它只有這麼多分,但是奧賽是能夠清晰的衡量一個人在那個年齡真正的聰明程度或智商水平的。
所以說我覺得幻方他雖然團隊的人數可能不是很大,但他招的是在單科單項上都是非常強的人才。但是再看海外這些大廠,招的即便是頂尖名校的,其實更偏我們這些年比較流行的素質精英教育。如果從團隊的純度來講的話,幻方的團隊的純度的會更高一些,它是一個很強的公司。
而且當一個科技創新出現的時候,大公司它往往會有團隊合作的問題,資源分配的問題,包括對自我顛覆的問題,效率有時候也會有一些問題。所以從這一點上講,Deepseek的出現讓我們很驚喜也很驚訝,但是如果再去看它出現的成因,好像又是可以理解的。
童飛:有一些說法是,Deepseek的性能全面超越了GPT,從性能來講不一定,但是它確實實現了高性能和低算力,這一點是比較明確的。
問:Deepseek導致美國科技股的下跌,是因爲他用了更低的訓練成本嗎?
於騰達:最開始的時候這個邏輯的演繹是最簡單清晰的,它用了更少的成本做到了比較好的一個效果,當然大家再去拆解的時候,去尋找這其中的原因,包括說它可能繞過了CUDA用了更底層的語言去做編譯。從第一層大家能夠看到的直觀邏輯上講,就是他用了更低的成本實現了比較好的效果,這就是美國芯片龍頭下跌的最直接的原因,因爲畢竟北美那幾家廠商,每一家公司每年的資本開支都是在大幾百億美金水平。
問:相比其他芯片廠商,英偉達的壁壘是什麼?
於騰達:英偉達是一個它從最早的顯卡時代到挖礦時代,再到現在的AI時代,它公司的底色是並行運算。並行運算在全球範圍內它應該是最強的,只是說它因爲顯卡而起家,後來又遇到了挖礦時代,包括現在AI時代,在這個事情上是先發優勢的,它不是一個後發優勢的產業,所以說英偉達的優勢其實一直在擴大,包括它競爭對手AMD的財報,我們會發現它跟英偉達的出貨的差距其實是在拉大的。
這一點上我覺得英偉達就好多人也關心,那天晚上可能很多人問英偉達是不是要做空或者是怎麼樣。結論是這樣的,只能說英偉達從一個比較簡單的去做判斷的階段,到了一個相對比較難去做的判斷,但是說它的行情結束了,可能還爲時尚早。
從最新的北美一些應用公司的電話會議裏面,我們會聽到一些他們的觀點,我記得有一家應用公司的CEO,他會說毫無疑問現在現在在AI最重要的產業上面,中美是軍備競賽的,所以說再怎麼投入,包括封鎖都是不爲過的。
包括其實我們在其他的很多行業裏面都會看到,像當年的手機產業鏈,這還不算是一個高端的科技行業,蘋果一家公司就賺了整個行業95以上的利潤,所以說在科技行業裏面永遠是隻要你有斷崖的領先優勢,你就會收割這個行業裏面絕大部分的利潤。只能說可能出現了一種訓練方式,讓訓練的效率變高了,但是對於算力的需求,還是這些大廠短期不會停下的事情。如果從商業模式上來講,它是一個相對優勢的軍備競賽,比如說如果你考了90分,另一家考了95分,那還是95分的這家公司收割了大部分的超額利潤。
所以我覺得在這件事情上,大家在算力上的投入不會停下來,除非大家所有人都摸到了這個行業的瓶頸跟天花板,但現在顯然大家還沒有。如果到了那個時刻,可能說算力的投資是進入了尾聲,或者說已經結束了,在現在這個環境下面,英偉達依然是這裏面最好的選擇,而且他跟後面的人差距在拉大。
問:在基本面上的影響上,我們怎麼去看在R1出來之後,我們對算力的需求的增減?
於騰達:只能說趨勢還是向上的,只能說大家會很快地摸到了,從原來70分80分這個水平很快就摸到了90分,但到了90分之後,大家還會想往上走,還是要持續的去做追加算力的投入。跟當年挖比特幣很像,只有你的算力比別人強,你才能挖到幣。
我的結論是,如果說算力的投資在過去兩年是一個從難易角度上講,是一個比較容易下結論的事情,到現在變成了一個相對複雜相對困難的事情。但是如果你站在它的反面說要做空,也是一件比較危險的事情。
童飛:如何看待推理需求的增長,我覺得是我們訓練需求減少,但是推理需求其實是一直是存在的,而且其實我們今年是推理大時代,核心是AI應用有望爆發。
在19世紀傑文斯研究蒸汽機的時候,他發現效率提高,成本下降,但是我們反而大家更多的去使用了煤炭,因爲煤蒸汽機提高了我們的效率,但它煤炭量使用量還增加了。這是因爲我們通過低成本的AI大模型,我們拓展了AI應用的場景,使得各行各業都快速落地,從而迅速去推高了推理的需求。
這一點就是說如果AI應用,能有一個很低的成本來實現商業化,並且我們有良好的大模型的性能,這種性能其實可以很快的去豐富我們的應用,從而反哺我們的推理需求,來進一步的來推高我們的算力需求。
問:對於英偉達來說,推理需求的上漲是否一定意味着英偉達的推理需求的上漲?
於騰達:在推理這個環節,他可能給了其他的芯片公司一些機會。因爲訓練這個環節可能對於英偉達的需求要求可能是比較高的,但是Deepseek的出現,我的感覺是給了國產的芯片,包括一些第二梯隊的芯片機會。
如果到推理這個環節,可能到最後落地到應用的時候,是針對特定行業特定場景特定需求,到時候的芯片完全是可以定製化的。但是訓練端可能還是英偉達的優勢會比較大。
童飛:我補充一下,其實推理跟訓練對於芯片需求有一個很大的不同在於計算精度。我們訓練當中,要用至少FP16以上了,但是我們在推理的過程當中,可能INT8或者FP16、FP18,都有可能,它的計算精度是下降的。並且它對內存的需求可能更高。但國產卡可能計算的性能差一點,但顯存配備可能都是高配,反而更加的合適。
另一點要提示一下,推理其實要考慮性價比,性價比是一個非常重要的點,英偉達的卡因爲禁運也好,因爲各種因素也好,大家在囤卡也好,它的價格是比較高的,但國產卡價格沒有那麼高,更具性價比。
我再補充一點,訓練是需要非常多算子的,推理就不需要那麼多算子。這個過程當中,一個大模型訓練,每天都有不斷的新的論文出來,都要有新的訓練技術,這個時候你就要不斷寫新的算子,CUDA生態有這麼多開發者,400萬開發者,算子庫不斷完善,做訓練就非常好。但是做推理我們可能用到訓練的算子是非常少的,這一點其實給國產卡利用的機會是非常多的。
問:客觀評價一下,國產芯片距離能夠支持世界級AI創新還有多遠?
童飛:還有比較長的路要走,即使是在推理層面。在算力、能效和兼容性等方面仍有不足。主要的原因還是產品不成熟,需要在應用中不斷打磨。但也就像Deepseek追上了海外一樣,我們對芯片我們也可以多一份信心。
問:上次錄播客的時候,達哥提到,AI投資正在由算力買鏟子階段走向下游應用搭房子階段。幾個月過去了,你覺得拐點來了嗎?
於騰達:拐點已經來了。我們國家這邊很多的計算機或者應用公司,其實都是中小公司,它在很長時間內可能沒有能力自己去做一個大模型,但Deepseek出來之後,它是開源模型,能夠讓任何公司去做一個本地化的部署。這就像半導體行業裏面,並不是每一家芯片設計公司都需要自己去製造自己的芯片,它去找臺積電流片就可以了,它依然能成爲非常優秀的芯片設計公司,這一點在應用這個行業裏面,我感覺是正在發生。從春節後的股票市場來看,大家也是在演繹這個邏輯,而且是非常強烈的。
童飛:我覺得要關注幾點,首先商業化的實際部署,拐點有可能真的快要到來,我們最近幾天我們看到了非常多,真的是千行百業的公司都在進入Deepseek,我們看到最近很多醫藥公司都宣佈自己接入Deepseek,甚至我們很多基金公司都宣佈了。
第二點是創新帶來的機遇,我相信Deepseek它只是一個開局,他們現在一定還在做模型的迭代,後面可能會有更驚豔的模型出來,包括我和字節的溝通,他們也在做內部很多的大模型的研發。所以我覺得 Deepseek只是技術創新的開局。
問:您之前提到關注科技巨頭財報數據,科技巨頭有什麼新故事?接下來要重點關注什麼?
於騰達:我現在比較開心的是,科技巨頭財報變得沒有那麼重要了,此前最重要的數據是他們的資本開支以及他們商業化的表述,但是這兩個事件現在都在其他更多的環節更高頻的行業的變化可以得到體現,Deepseek就是一個很好的例子。
我們也可以看到在Deepseek出現之後,這幾個大廠最近剛出了最新的財報,他們的資本開支對2025年的展望依然是向上的,大家並沒有在算力這件事情的投資上慢下來,大家一定都想去搶佔制高點。
那麼從商業化表述上來講,更多的AI賦能到了更多的應用公司軟件公司,美股也有軟件公司,我們這邊也有一些軟件和應用的公司,在自己的收入上慢慢的已經有了一些體現,比較高興的是有越來越多的信息可以輔助我們去觀察這個行業了。科技巨頭財報也是依然很重要,但變得沒有那麼重要了。
問:AI下游應用的新故事可能在哪裏?
於騰達:Deepseek它本身就是一個應用,它作爲一個APP的形式呈現在了我們的手機上,所以後面在一些搜索推薦、圖文展示、視頻剪輯優化,語音交互上應該都會很快看到一些落地,這方面有大量的訓練的語料,同時它有比較強勁的一個應用場景和需求。
童飛:我覺得有幾點,首先是效率革命與成本降低。DeepSeek的高性價比模型證明了,只要算法先進,訓練成本跟推理成本都可以大幅度下降。這將會刺激整個大模型行業快速落地,對於整個行業非常有益。從行業長期發展來看,DeepSeek對下游應用落地起到很好的促進作用,所有和編程、數理推斷相關的行業,如金融、互聯網、法律等領域,都會得到極大發展。
此前我們對國內AI可能沒有那麼強的信心,但DeepSeek出來之後,我覺得巧思很重要。我們人腦的功率是10~30瓦,但是一塊A系列的芯片都要700瓦的功率了,人腦用這麼低的功率就完成了我們這麼多豐富的研究成果,所以很多時候可能算法上的巧思也很重要。
其次是場景化應用的深化。DeepSeek的模型在特定場景中表現出色,例如編程、數學推理和長文本處理時。其在垂直領域(如醫療、法律、客服)中更具競爭力。
最後是Agent(智能體)的崛起。DeepSeek模型在反思和學習方面的能力,使其在代理(Agent)領域展現出了顯著的潛力。展望未來,那些具備自主決策能力的代理有可能在客服、研發、運營等多個場景中引發變革,從而成爲人工智能應用的一個嶄新方向。
問:Deepseek能否改變中國軟件企業商業模式?
於騰達:DeepSeek的出現可能會省去大量的重複性的工作,包括在我們自己的投研領域,很多投研的紀要交流路演,其實都是重複化的。我們投研會用到一些軟件,能夠壓縮了人員的需求,但是又呈現出了更好的產品。未來在AI的浪潮下,他們研發費用的壓縮,但是呈現了更好的產品,跟用戶達到了共贏的效果,這些公司的利潤會呈現比較好的自然而然的上升。
問:會讓AI輔助投資決策嗎?
於騰達:如果現在 AI時代算智能2.0,他可能會知道我想知道什麼,但他其實提供的是中性的回答,不會給到非常鮮明的投資推薦,只能做到更好的信息呈現。投資的模型是一個更復雜的模型。DeepSeek做的是一件科學的工作,但是投資不只是一件科學的數據性的工作,他沒法給出結論性的內容。
問:DeepSeek現在最需要什麼,有什麼是二級市場的上市公司能夠提供的?
童飛:它最需要兩點,第一點,人才是他非常渴求的。第二點,合規的算力。我們認爲當下節點DeepSeek對於商業化的興趣不大,他們最需要的是在基礎模型領域做出進一步的創新。圍繞這一點,他們需要招募更多有創造性的人才。爲了給人才提供有競爭力的薪水,還需要提供資金。DeepSeek可能需要更多的訓練卡,以滿足不斷創新迭代大模型的需求。對於推理端,DeepSeek因爲人員太少難以支持工程細節落地與優化,產品力、工程力可能難以和大廠媲美。他們主要是基礎模型人才,而工程落地、產品優化需要大量的人員。
問:Deepseek會成爲中美科技戰的一個里程碑嗎?怎麼看更加宏觀的影響?
於騰達:在這之前所有的創新我們都是跟隨者,尤其在底層的科技創新上面,我們的優勢就在於我們的人口是比較多的,所以一般在產業的中後段的應用環節,我們是後發先至的。但這一次在底層的大模型這件事情,我們已經能夠進入到全球第一梯隊,不僅是第一梯隊,而是全球只有兩個國家能夠做這件事情,我們是其中的一個。所以我覺得毫無疑問,這是科技領域的里程碑的事件。
童飛:我不太喜歡用中美科技戰這個詞,我覺得它可能更多是一個博弈的過程。我自己更希望是中美科技公司可以不斷去合作,合作能夠帶來更大的發展。那麼如果說就是說從技術的進步上來講,我們第一次從追趕者變成了一個相對領先者,我們也給整個AI產業做了很大的一個貢獻。這一點某種程度上講可以有一定里程碑意義。過去我們都在模仿,我們第一次有了創新,對這個是最大的變化。
觀點僅供參考,不構成投資建議或承諾。個股信息僅供參考列示,不構成投資建議或承諾。市場有風險,投資需謹慎。
責任編輯:王若雲
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。