2025 年是 AI Agent 元年——這句話,在北京時間 3 月 6 日凌晨,得到了應驗。
「DeepSeek 之後,又一個科技圈的不眠之夜。」
不少用戶在社交媒體上如此點評。
所有人徹夜蹲守,只爲該產品的一個使用邀請碼——它就是 Monica.im 研發的全球首款 AI Agent 產品「Manus」。
據團隊介紹,「Manus」是一個真正自主的 AI 代理,能夠解決各類複雜多變的任務。與傳統 AI 助手不同,Manus 不僅能提供建議或答案,還能直接交付完整的任務成果。
圖片來源:Monica.im
正如「Manus」的名字寓意,它在拉丁文裏象徵着「手」。也就是說,知識不僅要在腦子裏,還要能用手執行。這正是 Agent 和 AI Bot(聊天機器人)產品的本質進階。
Manus 牛在哪裏?最直觀的是看官方網站展示、以及用戶自發展示的使用用例,極客公園部分整理如下:
旅行規劃:不僅整合旅行信息,還爲用戶創建定製旅行手冊。例如,爲用戶規劃日本四月旅行,提供個性化的旅行建議和詳細手冊。
股票分析:進行深入的股票分析,設計視覺上吸引人的儀表盤展示全面的股票洞察。例如,對特斯拉股票進行深度分析,創建可視化儀表盤。
教育內容創建:爲中學教師創建視頻演示材料,解釋動量定理等複雜概念,幫助教師更有效地教學。
保險政策比較:創建清晰的保險政策比較表,提供最佳決策建議,幫助用戶選擇最適合的保險產品。
供應商採購:在整個網絡中進行深入研究,找到最適合用戶需求的供應商,作爲真正公平的代理爲用戶服務。
財務報告分析:通過研究和數據分析捕捉市場對特定公司(如亞馬遜)的情緒變化,提供過去四個季度的市場情緒分析。
創業公司列表整理:訪問相關網站識別符合條件的公司,並將其整理成表格。例如,整理 YC W25 批次的所有 B2B 公司列表。
在線商店運營分析:分析亞馬遜商店銷售數據,提供可操作的洞察、詳細可視化和定製策略,幫助提升銷售業績。
當 Agent 通過一長串思維鏈和工具調用,最終輸出一個無比完整、專業的結果時,用戶們開始感嘆「真的能幫人類做事了」。
根據官方網站信息,在GAIA基準測試(評估通用AI助手解決真實世界問題的能力)中,Manus在所有三個難度級別上都取得了新的最先進 (SOTA) 表現。
總結成一句話——Manus 更想做的,是你在數字世界中,字面意義上的「代理人」。而它做到了。
就像你想的一樣,凌晨推出的 Manus,一下子把所有 AI 圈的人都炸醒了!
01
Manus,你的「數字代理人」
首先,Manus 在體驗上與此前 LLM 最大的不同:
它強調直接交付最終結果的能力,而不只是給出一個單純的「答案」。
Manus 目前採用 Multiple Agent 架構,運行方式與此前 Anthropic 發佈的 Computer Use 類似,完全運行在獨立虛擬機中。同時可以在虛擬環境中調用各類工具——編寫和執行代碼、瀏覽網頁、操作應用等,直接交付完整成果。
在官方發佈的視頻中,介紹了三個 Manus 在實際使用場景中所完成的工作案例:
第一個任務是篩選簡歷。
從 15 份簡歷中,爲強化學習算法工程師職位推薦合適的候選人,並根據其強化學習專業知識對候選人進行排名。
在這個演示中,你甚至不需要給壓縮文件解壓、將其中的簡歷文件一份份手動上傳。Manus 這時候就已經展現出了像人類「實習生」的一面,手動解壓縮文件,並逐頁瀏覽每一份簡歷,同時記錄其中的重要信息。
圖片
Manus 像實習生一樣,自動理解「解壓老闆扔過來的打包文件」這個隱藏指令 | 圖片來源:極客公園
在 Manus 給出的結果中,不僅有自動生成的排名建議,它還會根據工作經驗等重要維度,將候選人分爲不同等級。在接受到用戶更希望以 Excel 表格的方式呈現後,Manus 還能自動將這些內容通過現場編寫 Python 腳本的方式,來生成對應的表格。
Manus 甚至還能通過記憶能力,在這個實踐過程中記錄下「用戶更喜歡通過表格的方式接受結果」這樣的信息,下一次處理類似的任務結果時,會優先使用表格的形式來呈現。
圖片
Manus 能記住用戶在內容生成流程中的偏好 | 圖片來源:極客公園
第二個案例,更爲國人量身打造,就是遴選房產。
案例中用戶希望在紐約購買房產,輸入的要求是希望同時有安全的社區環境、低犯罪率,以及優質的中小學教育資源—— 當然還包括最重要的預算,足夠在每月固定收入的情況下負擔的起。
在這個需求中,Manus AI 將複雜任務分解爲待辦事項列表,包括研究安全社區、識別優質學校、計算預算、搜索房產等。並通過網絡搜索,仔細閱讀有關紐約最安全社區的文章,收集相關信息。
其次,Manus 通過編寫一個 Python 程序,根據用戶收入計算可負擔的房產預算。結合房地產網站上相關的房價信息,根據預算範圍篩選房產列表。
Manus 能夠自動搜索、並過濾掉條件不符合用戶要求的房源 | 圖片來源:極客公園
最後,Manus 會整合所有收集的信息,撰寫詳細報告,包括社區安全分析、學校質量評估、預算分析、推薦房產列表以及相關資源鏈接——就像一個專業的房地產經紀人一樣。而且由於 Manus 自帶「完全基於用戶利益考慮」的屬性,其使用甚至體驗更好。
在最後一個案例中,Manus 展示了對股票價格的分析能力。
案例給出的任務是分析過去三年中英偉達、邁威爾科技和臺積電股票價格之間的相關性:衆所周知這三支股票之間存在緊密的關聯性,但對於新手用戶來講,很難快速將其中的因果關係整理清楚。
而 Manus 的操作,與一個真正的股票經紀人非常相似,它先是通過 API 訪問雅虎金融等信息網站,來獲取股票歷史數據,同時還會交叉驗證數據準確程度,避免被單一信息來源誤導,對最終產生結果帶來重大影響。
在這個案例中,Manus 同樣用到了編寫 Python 代碼、進行數據分析和可視化的能力,同時還引入了金融相關的專業工具進行分析,最終通過數據可視化圖表,搭配詳盡的綜合分析報告的方式,向用戶反饋其中的因果關係——真的就像一個金融領域「實習生」做的日常工作。
不僅如此,在 Manus 官網還展示了十多個 Manus 能夠使用的場景:直接使用 Manus 幫你整理行程、個性化推薦旅遊路線,還能讓它學習使用各種複雜工具,來流程化的完成日常工作。
在這個過程中,真正讓 Manus 展現出與往常工具不同的,是它的自主規劃,來確保執行任務的能力。
自主學習的能力也讓 Manus 的工作能力提升邏輯更像是真正的人類——即使現階段,它可能還無法在某一個特定領域做到專家級別的精通,但已經能看到巨大的潛力。
隨着自主學習能力的加入,AI Agent 的泛用性得到了巨大的提升,在用戶對 Manus 的實際測試中,你甚至可以做到直接對它描述一個視頻畫面中的相關內容,Manus 最終能夠直接根據對應的信息,跨越平臺內容對於搜索引擎的限制,精準找到某個抖音短視頻的鏈接。
由於目前版本的 Manus 完全基於雲端異步運行,因此實際上 Manus 的能力並不被你所使用的端側平臺形態或算力等因素限制——用戶甚至可以做到在向 Manus 下達指令之後,暫時關閉電腦,當 Manus 執行完成活動結果後,會自動通知你結果。
這個操作邏輯同樣非常眼熟——就像一個人下班以後,在微信上喊實習生「文件整理好發我」。只不過,現在,這個實習生是真的可以 7x24 小時的響應你了,並且不用擔心他會「整頓職場」。
02
多代理+自查,跑通 AI Agent 流
從上面這些案例,其實不難看出 Manus 真正的殺手鐧,並非 Computer Use 中已經出現過的「AI Agent」概念,而是它「模擬人類方式工作方式」的能力。
比起「運行計算」,Manus 的工作邏輯更像是「思考並執行命令」。它並沒有做到哪些人類當前真正無法做到的事;這也就是爲什麼一些已經體驗過當前版本 Manus 的用戶,將它形容爲「一個實習生」。
在 Manus 官網,展示着衆多 Manus 能夠完成的任務,其中就有一個案例,展示了在 B2B 業務中,如何使用 Manus。快速精準的將你的訂貨需求,與全球供應商實現精準匹配。
在類似需求的常規產品中,在平臺內整合全球供應鏈企業信息,來幫助用戶完成供貨商/需求方匹配這件事,是業內通行的邏輯。但這件事在 Manus 的案例中,你能看到完全不同的實現方式。
Manus AI 使用一套名爲「Multiple Agent」的架構,運行在獨立的虛擬機中。通過規劃代理、執行代理、驗證代理的分工協作機制,。來大幅提升對複雜任務的處理效率,並通過並行計算縮短響應時間。
在這個架構中,每個代理可能基於獨立的語言模型或強化學習模型,彼此通過 API 或消息隊列通信。同時每個任務也都在沙盒中運行,避免干擾其他任務,同時支持雲端擴展。每個獨立模型都能模仿人類處理任務的流程,比如先思考和規劃,理解複雜指令並拆解爲可執行的步驟,再調用合適的工具。
換言之,通過 Manus 的這套多代理架構,它更像是由多個助理,通過協助的方式,分別完成檢索資源、對接、驗證信息是否有效等工作,來幫你完成整個工作流程——這實際上不僅像是你招了一個「實習生」,更像是直接當上了一個微縮版的「部門主管」。
在 B2B 業務這個案例中,Manus 通過網頁爬蟲以及代碼編寫、執行能力,Manus 會自動在互聯網這片汪洋大海中檢索,根據你自己的需求,對潛在供應商從產品質量、價格、交貨能力等方面,爲你匹配到最合適的貨源。不僅可以將結論以圖表的方式直觀呈現在你眼前。還能對這些數據進一步給出更加詳細的操作建議。
圖片
Manus 完成 B2B 場景下的需求,或許比單一平臺的內建工具更好用 | 圖片來源:極客公園
至於 Monica 團隊到底如何、用何種技術實現的視頻效果,根據消息,團隊或將在北京時間 3 月 6 日爲大家揭曉。
03
「縫合」的極致,就是炸裂
Manus 背後的 Monica.im,到底是傢什麼公司?
Monica 是一款 All-in-One 的 AI 助手,產品形態從瀏覽器插件、慢慢拓展至了 App、網頁端。主流的使用場景是,當用戶在瀏覽器中點開它的小圖標,就能直接使用其接入的各大主流模型。通過對細分場景用戶需求的準確理解,Monica 摘到了大模型「低垂的果實」。
其創始人肖弘(暱稱小紅,英文名 Red)是一位年輕的連續創業者,1992 年生,畢業於華中科技大學。2015 年,他畢業後創業,早期創業不算順利(如校園社交、二手集市)。2016 年,他創業微信公衆號運營者提供編輯與數據分析工具,獲得了百萬用戶、並完成了盈利,最終產品於 2020 年出售給了某獨角獸公司。
等到 2022 年大模型浪潮後,他正式創立 Monica,專注海外市場,通過獨立開發者產品 ChatGPT for Google,產品快速完成了冷啓動。
2024 年,在 GPT-4o、Claude 3.5、OpenAI o1 系列上線的第一時間,Monica 讓用戶可以獲得最新 SOTA 模型。隨着接入模型的新進展,Monica 推出的專業搜索、DIY Bot、Artifacts 寫小程序、記憶等功能也受到用戶喜愛。而 Monica 在 YouTube、Twitter、Gmail、The Information 等不同功能的網頁裏呈現出不同的交互形態和功能,以適配特定場景的用戶需求,更新了數百個網頁的個性化 AI 體驗。
2024 年,Monica 用戶數量翻番,達 1000 萬。同時,其保持着可觀的盈利,在海外同類產品中,位居頭部。
Monica 的強勁表現驗證了一件事:
套殼到極致,既是 TPF、也是 PMF,最後都通往用戶價值。
Monica 首頁 | 圖片來源:Monica
Manus 或許延續了 Monica 團隊這種思路——肖弘接受媒體人張小珺的訪談時表示,產品不能只有聊天機器人一種形態,Agent 會是新增的形態、需要新的產品去承接。
他從 AI 編程產品 cursor 和 Devin 中獲得了靈感。據極客公園瞭解,前者主要是 copilot 模式、後者則是 autopilot 模式,後者更符合人性需求。Agent 也應該像 Devin 一樣,面向大衆人羣、真正由 ai 主導進行執行。但過去的問題是,模型不夠聰明。
但基於模型已有能力去做場景的封裝服務,或許正是 Monica 團隊的優勢。肖弘說,目前 Agent 產品團隊並不多,因爲它需要很多複合能力,比如說團隊要搞過 chatbot、AI 編程、瀏覽器相關(因爲都在瀏覽器上跑)、而且對模型的邊界要有不錯的感知——今天發展到什麼水平,接下來會發展到什麼樣的水平等等。
「同時擁有這些能力的公司沒那麼多,而有這些能力的公司,可能手頭正在幹一個很具體的業務,但我們恰好有同學剛好有時間一起把這件事情做出來。」他說。
爲什麼是 Monica 做出來了,他總結道,「第一,我覺得我們是比較幸運的。第二,某種程度上,如果今天大家都去做 reasoning 了,可能是不是又多出了一些時間給創業公司?模型預計能力外溢還能走多遠?」
他認爲,目前 Agent 還在早期階段。一是目前 Agent 還在規劃階段,還沒到物理世界的執行;二是大模型的能力還在往上發展,一切還不可預料。
「我肯定不知道 Agent,是可以被用這樣的方式被出來的,它是一個未知的事情。」他說。
耐人尋味的是,「不知道怎麼做 Agent」的 Monica,現在做出了一個讓整個 AI 圈感到炸裂的產品。
Manus 可能未必是最終的 AI Agent,但它無疑在 DeepSeek 爆火之後,再次將人們對 AI 的期望拉昇了一個數量級。
免責聲明:投資有風險,本文並非投資建議,以上內容不應被視為任何金融產品的購買或出售要約、建議或邀請,作者或其他用戶的任何相關討論、評論或帖子也不應被視為此類內容。本文僅供一般參考,不考慮您的個人投資目標、財務狀況或需求。TTM對信息的準確性和完整性不承擔任何責任或保證,投資者應自行研究並在投資前尋求專業建議。