谷歌公司4月17日宣佈,在Google AI Studio和Vertex AI中以API形式推出Gemini 2.5 Flash預覽版AI模型。這款混合推理模型具備動態計算能力,開發者可根據查詢複雜度靈活調整處理時間。
用戶可通過Gemini應用內的模型選擇器直接使用該模型,並結合Canvas工具優化文檔和代碼編輯。谷歌表示,Gemini 2.5 Flash專爲高容量、實時應用場景設計,特別適合客戶服務和文檔解析等需求,是響應式虛擬助手和實時總結工具的理想選擇。
作爲首款全混合推理模型,Gemini 2.5 Flash允許開發者按需開關推理功能,平衡響應質量、成本和延遲。與同類前沿模型相比,其成本優勢明顯,定價爲每百萬tokens輸入0.15美元,輸出0.6至3.5美元不等。