路透社4月4日 - Meta Platforms META.O計劃在本月晚些時候發布其大型語言模型的最新版本,此前至少推遲了兩次。
不過,報道援引兩位熟悉內情的人士的話說,Meta 可能會再次推遲發布 Llama 4。
OpenAI 的 ChatGPT 成功改變了科技界的格局,並推動了對機器學習的投資,在此之後,大型科技公司一直在積極投資人工智能基礎設施。
報道稱,延遲的原因之一是在開發過程中,Llama 4 在技術基準方面沒有達到 Meta 的預期,尤其是在推理和數學任務方面。
報道還說,該公司還擔心 Llama 4 在進行類似人類的語音對話方面不如 OpenAI 的模型。
Meta計劃今年斥資高達650億美元 (link),以擴大其人工智能基礎設施,因為投資者對大型科技公司施加壓力,要求它們顯示投資回報。
此外,中國科技公司DeepSeek (link) 的低成本流行模型的崛起也挑戰了開發最佳人工智能模型需要數十億美元的信念。
報道稱,預計Llama 4將借鑑DeepSeek的某些技術方面,至少有一個版本將採用一種名為專家混合法的機器學習技術,該方法針對特定任務訓練模型的不同部分,使其成為這些領域的專家。
報道稱,Meta 還考慮先通過 Meta AI 發布 Llama 4,之後再作為開源軟件發布。
去年 (link),Meta 發布了基本免費的 Llama 3 人工智能模型,它可以用八種語言對話,編寫更高質量的計算機代碼,並能解決比以前版本更復雜的數學問題。
(為便利非英文母語者,路透將其報導自動化翻譯為數種其他語言。由於自動化翻譯可能有誤,或未能包含所需語境,路透不保證自動化翻譯文本的準確性,僅是為了便利讀者而提供自動化翻譯。對於因為使用自動化翻譯功能而造成的任何損害或損失,路透不承擔任何責任。)