亞馬遜推出Nova Act:可操控網頁瀏覽器的AI智能體

IT之家
04/01

IT之家 4月1日消息,亞馬遜於當地時間週一正式發佈了其通用人工智能智能體(AI agent)——Nova Act。該智能體具備操控網絡瀏覽器並自主執行簡單網絡任務的能力。與此同時,亞馬遜還推出了配套的Nova Act軟件開發工具包(SDK),旨在幫助開發者利用Nova Act構建智能體應用原型。

據IT之家了解,Nova Act由亞馬遜新近在舊金山成立的AGI(通用人工智能)實驗室研發,該技術未來也將為備受期待的生成式AI增強版語音助手Alexa+提供關鍵功能支持。不過,亞馬遜方面表示,今日起開放的版本為「研究預覽版」,功能尚待完善。

開發者可以通過新設立的專屬網站nova.amazon.com獲取Nova Act工具包,該網站同時也是亞馬遜展示其旗下各類Nova基礎模型的平台。

Nova Act的推出標誌着亞馬遜正式加入AI智能體技術的競爭行列,意在憑藉自研的通用AI智能體技術,與OpenAI的Operator和Anthropic的Computer Use等產品展開競爭。當前,多家領先科技公司普遍認為,能夠代替用戶瀏覽網頁、執行任務的AI智能體將極大提升現有AI聊天機器人的實用性。儘管亞馬遜並非首家開發此類技術的公司,但憑藉其龐大的Alexa用戶基礎,Nova Act未來可能擁有最廣泛的應用潛力。

亞馬遜介紹稱,開發者使用Nova Act SDK,將能夠為用戶自動化處理一些基礎性網絡操作,例如從餐飲品牌Sweetgreen訂購沙拉或是在線上預訂餐廳晚餐。該工具包提供了一系列工具,使AI智能體能夠瀏覽網頁、填寫表單、在日曆上選擇日期等。

在性能方面,亞馬遜聲稱,在公司內部的多項測試中,Nova Act的表現優於來自OpenAI和Anthropic的同類智能體。以衡量AI智能體與螢幕文本交互能力的ScreenSpot Web Text測試為例,Nova Act得分高達94%,超過了OpenAI的 CUA(88%)和Anthropic的 Claude 3.7 Sonnet(90%)。然而值得注意的是,亞馬遜並未公佈Nova Act在如WebVoyager等行業更常用的智能體評估基準上的測試結果。

Nova Act是亞馬遜上述AGI實驗室對外發布的首個公開產品。該實驗室由前OpenAI研究員David Luan 和 Pieter Abbeel共同領導。這兩位專家在去年被亞馬遜聘用以主導其AI智能體研發工作之前,分別創立了AI初創公司Adept和Covariant。

對於一個以AGI為目標的實驗室為何會開發訂購沙拉的AI智能體,Luan在接受TechCrunch採訪時解釋道,他將智能體視為構建超智能AI系統的關鍵一步。他將AGI定義為「一個能夠幫助你在計算機上完成人類所能做的任何事情的AI系統」。Luan還表示,其團隊設計的Nova Act SDK旨在可靠地自動化執行簡短、簡單的任務,並為開發者提供了精確定義何時需要人類介入智能體工作流程的工具。他希望藉此幫助開發者創建更可靠的智能體應用,即使這些應用不一定是完全自主運行的。

目前,來自OpenAI、谷歌和Anthropic等公司的早期AI智能體普遍面臨跨不同領域應用時可靠性不足的重大挑戰。根據TechCrunch等媒體的測試,這些系統往往運行緩慢,難以長時間獨立工作,且容易犯下人類通常不會犯的錯誤。亞馬遜是否已經找到了克服這些難題的有效方法,還是其Nova Act智能體也將受困於同樣的缺陷,市場將拭目以待。

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10