怎麼用DeepSeek高效開發應用?解讀亞馬遜雲科技三大祕籍

智東西
02-17

作者 | ZeR0

編輯 | 漠影

智東西2月17日報道,隨着DeepSeek展現出開源的威力,大模型競賽有了新的敘事方式,各路雲計算廠商接連宣佈接入DeepSeek模型,但實際提供的服務質量卻參差不齊。這與雲服務背後的基礎設施和工程化能力密切相關。

企業部署和使用模型過程中,需要綜合考量性能與成本之間的權衡、能否針對私有數據進行定製優化、數據和模型安不安全、是否便於實現各種智能體的複雜調度等因素。亞馬遜雲科技則通過在雲和AI領域展開的全棧式創新,兼具雲端本身的優勢、多樣化模型選擇的優勢,並提供了一系列快速將模型運用到企業化生產環境中所需的重要工具。

作爲最早適配並上線DeepSeek的雲巨頭之一,亞馬遜雲科技現已推出針對DeepSeek-R1模型多種不同的部署方式,以便企業能在熟悉的亞馬遜雲科技環境中輕鬆部署該系列模型,例如在Amazon Bedrock Marketplace中部署,或在Amazon SageMaker Jumpstart中部署,也可以通過Amazon Bedrock自定義導入功能或Amazon EC2 Trn1實例中部署DeepSeek-R1-Distill系列模型。

一、雲端部署:靈活可擴展,與豐富服務無縫集成

相比本地部署,雲端部署的優勢是算力資源更充足,而且靈活可擴展。同時在雲端部署能夠與豐富且成熟的分析、數據等基礎服務進行無縫集成。作爲全球雲計算的開創者,亞馬遜雲科技近20年來積累了深厚的技術根基,引領了一代代的雲端基礎設施創新,在提高算力利用率、加速模型開發等方面都有長期經驗。

比如在自研芯片領域,亞馬遜雲科技推出了基於Amazon Trainium2的EC2 Trn2實例,性價比比當時GPU實例高30%-40%。還有第二代的UltraCluster網絡架構,支持超過20000個GPU協同工作,帶寬達10Pb/s,延遲低於10ms,這一升級能夠將模型訓練時間縮短至少15%。

亞馬遜雲科技推出的新一代Amazon SageMaker,將快速SQL分析、PB級大數據處理、數據探索和集成、模型開發和訓練以及生成式AI等功能統一到一個集成平臺,從而爲客戶提供一個單一的數據和AI開發環境,用戶可以在其中查找和訪問其組織中的所有數據,爲各種常見的數據用例選擇最佳工具,並將數據和AI項目擴展至團隊內不同分工角色以實現協作。

亞馬遜雲科技大中華區產品部總經理陳曉建談道,亞馬遜雲科技不僅在雲的核心服務層面持續創新,更在從芯片到模型,再到應用的每一個技術堆棧取得突破,讓不同層級的創新相互賦能、協同進化。

他相信只有這樣全棧聯動的大規模創新,才能真正滿足當今客戶的發展需求,加速前沿技術的價值釋放。

二、多樣化模型選擇,按需組出性價比

跟其他雲服務大廠相比,亞馬遜雲科技生成式AI服務的一大特色,就是模型選擇多。

基於“不會有一個模型一統天下”的判斷,亞馬遜雲科技在自研大模型的同時,也將來自不同企業、不同功能的領先大模型匯聚在一起,放到雲中的“大模型貨架”上,供客戶按需實現最具性價比的組合。

在實際構建生成式AI應用時,不同應用場景需要的性能、成本、響應速度、微調能力、知識庫協調能力、多模態支持能力等技術指標各不相同。比如在快速響應場景,需要花一些時間推理的DeepSeek R1深層思考模式就不太適用,其生成首個token的用時可能要超過30秒;而Amazon Nova模型的響應就非常快,只耗時數百毫秒。

此前其“大模型貨架”上已經有來自AI21 Labs、Anthropic、Cohere、Meta、Mistral AI、Stability AI、Luma AI和poolside等知名廠商的大模型。亞馬遜雲科技還在不斷擴展其模型“朋友圈”。

比如上個月Amazon Bedrock平臺剛剛上線了Luma AI的最新版視頻生成模型Ray 2模型,可以廣泛用於內容創建、娛樂、廣告和媒體使用案例,從而簡化從概念到執行的創意流程。

亞馬遜雲科技的Amazon Bedrock Marketplace功能爲客戶提供100多個熱門、新興及專業模型,DeepSeek-R1就包含在內。

▲在Amazon SageMaker Jumpstart中快速部署DeepSeek模型

三、企業級AI工具全家桶:從性能提升到複雜多智能體編排

選擇合適的模型,下一步是如何高效解決工程化難題。

Amazon Bedrock聚焦企業應用AI的實際需求,提供了企業AI工具全家桶,涉及模型從原型走向企業化生產環境時必須要考慮的方方面面的工具,以便開發者基於領先模型來快速構建應用。

例如DeepSeek模型有不同參數量,小至幾十億,多達6710億。要實現完整部署R1並實現儘可能好的推理和響應,需要如Amazon EC2 P5e性能級別的硬件和配套的便捷工具。

▲通過Amazon Bedrock Marketplace部署DeepSeek-R1,可選實例包括EC2 P5e的48xlarge型號,單個實例包含8顆H200 GPU,以及3200Gbps的網絡帶寬,充分滿足DeepSeek-R1的性能需求

亞馬遜雲科技提供的實用工具有助於優化成本、根據自有數據定製提升準確性、安全性以及針對未來複雜的多智能體構建和管理等。可以簡要概括爲以下4類:

1、優化效果、延遲和成本:如低延遲優化推理、模型蒸餾、提示詞緩存等功能,大幅提升推理效率。其中模型蒸餾功能可將特定知識從功能強大的大模型轉移到更小更高效的模型,運行速度最快可提高500%,成本降低75%。

2、基於企業自有數據的定製優化:模型微調功能、知識庫功能不斷豐富,現已支持GraphRAG等圖數據,能夠快速且經濟高效地從文檔、圖像、音頻以及視頻中提取信息,並將其轉換爲結構化格式的Amazon Bedrock Data Automation功能等。

3、負責任AI的安全和審查:Amazon Bedrock不斷豐富其護欄功能,以簡化企業實施負責任AI所需的投入,例如爲其加入自動推理檢查功能,從而能夠輕鬆識別事實性錯誤,以提升生成回答的準確性。

4、實現複雜功能的多智能體功能:Amazon Bedrock不但提供智能體功能,還進一步推出了多智能體協作功能,使客戶能夠輕鬆地構建和協調專業智能體來執行復雜的工作流程。客戶可以通過爲項目的特定步驟創建和分配專用智能體,獲得更準確的結果並加速任務。

▲在Amazon Bedrock模型定製頁面部署DeepSeek 88Llama Model

結語:用全棧式創新託舉企業級AI構建

在2024 re:Invent上,亞馬遜CEO Andy Jassy曾分享亞馬遜自身部署AI中的三項關鍵洞察:首先,隨着生成式AI應用規模的擴大,計算成本變得至關重要;人們非常渴望獲得更高的性價比;其次,構建一個真正優秀的生成式AI應用非常困難;第三,永遠不會有單一的工具能夠統治世界,要提供多樣化的模型,讓開發者自由選擇。

亞馬遜雲科技在雲端部署方面的靈活可擴展性、多樣化模型選擇以及實用工具的提供,則無一不是對這些洞察的有力回應。

通過上述三大優勢,亞馬遜雲科技正在幫助企業更快更好地運用領先的模型。亞馬遜雲科技對DeepSeek的積極擁抱,也在踐行其此前向客戶所承諾的——託管最流行的、具有創新性的AI模型。隨着DeepSeek催化開源風暴,未來我們將看到更多優質新模型的誕生,而無論模型種類如何繁多,亞馬遜雲科技的全棧式創新都形成穩固的託舉。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10