字節跳動實習生投毒自家大模型細節曝光,影響到底有多大?

鳳凰網科技
2024-10-19

鳳凰網科技訊(作者/董雨晴)10月19日,字節跳動大模型訓練遭實習生攻擊一事引發廣泛關注。據多位知情人士透露,字節跳動某技術團隊在今年6月遭遇了一起內部技術襲擊事件,一名實習生因對團隊資源分配不滿,使用攻擊代碼破壞了團隊的模型訓練任務。

據悉,該事件的主要涉事者爲一名田姓實習生所爲,他利用了Huggingface(HF)平臺的漏洞,在公司的共享模型中寫入了破壞代碼,導致模型訓練效果忽高忽低,無法產生預期的訓練成果。

一位前字節技術員工表示,“字節AI Lab的實習生權限和正職員工差異不大,也使得此次事件有了發生的機會”,其也對此次事件帶來的惡性影響表達了擔憂,“這件事之後肯定會極大地收縮實習生的權限”。

在消息曝出後,該名涉事實習生試圖在社交平臺上闢謠,將責任推給他人,不過很快便遭到了接近字節跳動人士的否認。

據相關知情人士在Gitbub上表述,“你(指田某)在長達2個月的時間裏對集羣代碼進行惡意攻擊,對公司近30位各級員工造成巨大傷害,讓你的同事近一個季度的工作白費。所有的記錄和審查都證明這是不容狡辯的事實!

該名人士還分享了一則調查人員對田姓實習生 (TianKeyu)的詢問錄音,錄音中的對話還原其攻擊的過程:田某最先輸入的code本來是被用於影響通訊和隨機性的,“最開始的時候它並不是以攻擊爲目的,它是爲了debug,但這確實會涉及到程序的一些運行情況。但是後面它經過一些文件,就是那些upload文件,code也會被update,code就變成了攻擊code。它大概的作用就是去修改code,然後就會造成一些後果。”

錄音中疑似田某本人的回應承認了其通過update使得code帶有了攻擊性。其也對問詢人員明確表示,“就是因爲某些原因導致了我們都非常不滿”。

另據傳聞稱此次損失可能超過千萬美元,但內部人士表示實際損失並沒有傳聞中那麼嚴重。

據瞭解,該事件發生於今年6月底,目前字節跳動已對田姓實習生採取了辭退處理,並將此事通報給相關行業聯盟和該實習生所在的學校。

不過前述相關知情人士表示,除了被字節辭退,田某目前未受到任何處罰。

多方消息顯示,田姓實習生爲國內某高校在讀博士生,於2021年9月起在字節AI Lab實習,其所在的團隊剛在今年4月與北大王立威團隊提出了VAR研究,在圖像生成質量、推理速度、數據效率和可拓展性等方面均超過了DiT。此外,VAR的推理速度比傳統自迴歸模型快了約20倍。

截至發稿,字節跳動方面仍未對此事進行公開回應。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10