電腦突然狂彈網頁?這次可能是人家在幫你幹活

差評
04-03

電腦自己彈出來一堆網頁?中病毒了吧!

但這回真不是,還有可能是 AI agent 在幫你查東西幹活。

昨天世超去中關村智譜 OpenDay 湊了個熱鬧,近距離圍觀了智譜AI最新 AutoGLM 沉思的發佈。

相對大家夥兒已經很熟悉的各種 AI 助手只會打打嘴炮,智譜這 AI agent 已經不僅僅侷限在你問我答上了,還能幫你直接動手完成任務,歸納總結,提升答案的深度和廣度。

據說,AutoGLM 能先想再做,邊做邊想,聽起來挺高深莫測的。

那具體效果咋樣?世超當然也迫不及待地上手試了兩天。

先下結論:AutoGLM 沉思功能上做的還不錯,它能幫大家把一個複雜問題拆解,分步搜索,而且回答非常的全面。就是使用體驗方面還有些提升空間。

有了它,感覺以後再也不怕老闆讓寫年末總結報告了。

參考官網幾個用例,咱來看看具體測試效果是啥樣的。

事先說好啊,世超把問題扔給它就去開會了,全程沒碰過一下鼠標鍵盤。以下所有操作解釋權歸 AutoGLM 沉思所有。

先來問問它:人形機器人技術對未來生產模式會有什麼顛覆性影響?

這問題,換世超來也得想半天。但很快啊,AutoGLM 啪的一下就把思考步驟列出了一二三。

不僅能想,還敢幹。AutoGLM 先打開了知乎,去知乎搜了搜人形機器人在工廠環境下的最新案例。

它甚至知道篩選信息。

字太多不想看?它來幫你看。

二十分鐘後,AutoGLM 給出了一份總結報告。雖然也挺長的,但已經是幾十篇網頁的濃縮精華版了。

報告不僅概括了人形機器人可能在製造業,農業帶來的生產模式變革,還提供了對企業和研究機構的建議。

要是自己看完這幾十篇文章總結內容,二十個小時也未必夠。

不知道你行不行,世超覺得自己不太行。

再測個栗子:前幾天 ChatGPT-4o 的文生圖模型一出,有的差友在視頻下留言,原本是做設計師的,現在想轉水電工了。

那怎麼規劃才能在六個月之內迅速成爲一名優秀的電工呢?( 手動狗頭 )

AutoGLM 先在知乎搜了搜,設計師轉行做電工的相關信息。

別說,你真別說,這事看起來挺可行的,先例還不少。。。

知乎看差不多,再去搜搜小紅書。

最後生成一份學習報告,詳細列舉了這六個月每一階段的計劃,該學習什麼課程,具備哪些條件,報名哪些考試。

所以各位先別慌,按這個計劃來,現在轉行還來得及。

不過沒有比較就沒有傷害。世超又橫向測試了一下,有些方面 AutoGLM 沉思還是不如一月份 OpenAI 搞出來的前輩 Operator 。

同樣是搜索食譜,下面來看看這兩個 agent 的表現有什麼區別吧。

官方演示視頻裏可以看到,Operator 很絲滑地完成了奶油蛤蜊意麪食譜的搜索。

再來看看 AutoGLM 沉思,提示讓它給出一份糖醋排骨的食譜:

拋出問題,它很快開始思考,列出一個 5 步詳細計劃。

需要登錄信息或者有彈窗的時候,也要人幫幫忙。

在搜索欄輸入關鍵詞不在話下。

一開始 AutoGLM 沉思的表現還挺靠譜的,順利打開網頁、搜食譜,感覺一切盡在掌握。直到它打開了 4 個小紅書,3 個b站,2 個知乎頁面,事情好像哪裏不對勁了起來。。。

收手吧阿祖,是在家做糖醋排骨,不是國宴。

感覺 AutoGLM 總想做得更好,更全面,它會一直不停地搜索,更換信源,或者說希望找一個 “ 最優解 ”,一個 “ 標準答案 ”。

但是在面對 “ 糖醋排骨怎麼做 ” 這種根本沒有標準答案的問題時,它會花費大量時間去檢索,總結。

其實答案早就找到了,但它可能是 INTJ 吧,總是不太滿意。

十多分鐘過去了,糖醋排骨好像怎麼做都行,又怎麼做都不行。比起 Operator,它太糾結了。

除了搜食譜,找路好像也不太適合它。。。世超從中關村出來,剛在頤和園爽玩一圈,還想去北大看看。惦記着剛剛掏着的好東西,就想問問它從頤和園到北京大學的公共交通路線。

18 分鐘後,搜索終於結束了。

最後展示出的結果中,地鐵,公交,自行車,步行等等情況都被考慮到了,總結的非常全面到位。

唯一的問題是世超已經在北京的春風裏瑟瑟發抖了很久很久。

當然,這一點可能源自它 “ 沉思 ” 的特性,更適合解決複雜的,需要思考的問題。畢竟工具也要分使用場合,不能拿大炮轟蚊子。

不過在測試過程中,世超也確實遇到了一些其他的細節問題,會影響到使用體驗

比如在網頁搜索結果給出之後,有時候會等待很久,再進行點擊。

對話框顯示它沒有在思考,但網頁上也沒有在操作。作爲旁觀者的人類,看着它卡在那裏,答案也在那裏,卻不能上手替它點擊。

簡直是新時代酷刑,焦慮值瞬間拉滿。

但這畢竟只是個 Beta 測試版,正式版會不會修復這些問題還不好說。

綜合來看,AutoGLM 沉思作爲一款免費的國產 agent 表現還是不錯的,相比起 200 刀一月的 OpenAI Operator 和一碼難求的 Manus,性價比真心拉滿了,至少能讓大家先無痛體驗一下 AI 幫自己幹活是個啥感覺。

聽說 4 月還會開源,到時候可以再來圍觀一下還有什麼好玩的。

撰文:莫莫莫甜甜

編輯:江江 & 面線

美編:萱萱

圖片、資料來源:

莫莫實測、OpenAI-4o、AutoGLM沉思官網

免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。

熱議股票

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10