據媒體週五報道,Meta有望在本月發佈的新一代開源大語言模型Llama 4。此前這款大語言模型的發佈已至少經歷兩次延期,目前仍存在再度推遲可能。
這距離前代模型Llama 3的發佈已過去近一年,凸顯出Meta在AI軍備競賽中面臨的技術挑戰。
據Meta內部測試顯示Llama 4在數學推理(GSM8K基準)和代碼生成(HumanEval)準確率較Llama 3提升37%。
這款大語言模型多次延期的主因是多模態訓練數據清洗遇阻,特別是視頻-文本對齊質量未達預期。該模型需協調16000塊H100 GPU集羣,能源消耗較Llama 3訓練增加2.3倍。
行業觀察人士指出,若再度延期,Meta將錯過6月開發者大會的關鍵展示窗口。而競爭對手Anthropic的Claude 4和谷歌Gemini 2.0已分別計劃在Q3發佈重大更新。
責任編輯:張俊 SF065