4月1日上午消息,百度旗下深度學習平臺飛槳宣佈新一代飛槳框架3.0正式發佈,以“動靜統一自動並行”等五大核心技術創新,有效降低了大模型開發訓練成本。
作爲大模型時代的Infra“基礎設施”,大模型訓練、推理等任務都離不開深度學習框架的優化與支撐。據悉,目前飛槳框架3.0已支持文心4.5、文心X1等多款主流大模型,DeepSeek-R1滿血版單機部署吞吐提升一倍。
在運算速度上,藉助創新研製的神經網絡編譯器CINN,實現性能的顯著提升,部分算子執行速度提升4倍,模型端到端訓練速度提升27.4%。
在硬件適配方面,飛槳框架3.0推出了多 芯片 統一適配方案,目前已支持60餘款主流芯片,覆蓋訓練集羣、自動駕駛、智能終端等場景,開發者只需編寫一份代碼即可實現跨芯片無縫遷移,硬件適配成本直降80%。