电脑突然狂弹网页?这次可能是人家在帮你干活

差评
03 Apr

电脑自己弹出来一堆网页?中病毒了吧!

但这回真不是,还有可能是 AI agent 在帮你查东西干活。

昨天世超去中关村智谱 OpenDay 凑了个热闹,近距离围观了智谱AI最新 AutoGLM 沉思的发布。

相对大家伙儿已经很熟悉的各种 AI 助手只会打打嘴炮,智谱这 AI agent 已经不仅仅局限在你问我答上了,还能帮你直接动手完成任务,归纳总结,提升答案的深度和广度。

据说,AutoGLM 能先想再做,边做边想,听起来挺高深莫测的。

那具体效果咋样?世超当然也迫不及待地上手试了两天。

先下结论:AutoGLM 沉思功能上做的还不错,它能帮大家把一个复杂问题拆解,分步搜索,而且回答非常的全面。就是使用体验方面还有些提升空间。

有了它,感觉以后再也不怕老板让写年末总结报告了。

参考官网几个用例,咱来看看具体测试效果是啥样的。

事先说好啊,世超把问题扔给它就去开会了,全程没碰过一下鼠标键盘。以下所有操作解释权归 AutoGLM 沉思所有。

先来问问它:人形机器人技术对未来生产模式会有什么颠覆性影响?

这问题,换世超来也得想半天。但很快啊,AutoGLM 啪的一下就把思考步骤列出了一二三。

不仅能想,还敢干。AutoGLM 先打开了知乎,去知乎搜了搜人形机器人在工厂环境下的最新案例。

它甚至知道筛选信息。

字太多不想看?它来帮你看。

二十分钟后,AutoGLM 给出了一份总结报告。虽然也挺长的,但已经是几十篇网页的浓缩精华版了。

报告不仅概括了人形机器人可能在制造业,农业带来的生产模式变革,还提供了对企业和研究机构的建议。

要是自己看完这几十篇文章总结内容,二十个小时也未必够。

不知道你行不行,世超觉得自己不太行。

再测个栗子:前几天 ChatGPT-4o 的文生图模型一出,有的差友在视频下留言,原本是做设计师的,现在想转水电工了。

那怎么规划才能在六个月之内迅速成为一名优秀的电工呢?( 手动狗头 )

AutoGLM 先在知乎搜了搜,设计师转行做电工的相关信息。

别说,你真别说,这事看起来挺可行的,先例还不少。。。

知乎看差不多,再去搜搜小红书。

最后生成一份学习报告,详细列举了这六个月每一阶段的计划,该学习什么课程,具备哪些条件,报名哪些考试。

所以各位先别慌,按这个计划来,现在转行还来得及。

不过没有比较就没有伤害。世超又横向测试了一下,有些方面 AutoGLM 沉思还是不如一月份 OpenAI 搞出来的前辈 Operator 。

同样是搜索食谱,下面来看看这两个 agent 的表现有什么区别吧。

官方演示视频里可以看到,Operator 很丝滑地完成了奶油蛤蜊意面食谱的搜索。

再来看看 AutoGLM 沉思,提示让它给出一份糖醋排骨的食谱:

抛出问题,它很快开始思考,列出一个 5 步详细计划。

需要登录信息或者有弹窗的时候,也要人帮帮忙。

在搜索栏输入关键词不在话下。

一开始 AutoGLM 沉思的表现还挺靠谱的,顺利打开网页、搜食谱,感觉一切尽在掌握。直到它打开了 4 个小红书,3 个b站,2 个知乎页面,事情好像哪里不对劲了起来。。。

收手吧阿祖,是在家做糖醋排骨,不是国宴。

感觉 AutoGLM 总想做得更好,更全面,它会一直不停地搜索,更换信源,或者说希望找一个 “ 最优解 ”,一个 “ 标准答案 ”。

但是在面对 “ 糖醋排骨怎么做 ” 这种根本没有标准答案的问题时,它会花费大量时间去检索,总结。

其实答案早就找到了,但它可能是 INTJ 吧,总是不太满意。

十多分钟过去了,糖醋排骨好像怎么做都行,又怎么做都不行。比起 Operator,它太纠结了。

除了搜食谱,找路好像也不太适合它。。。世超从中关村出来,刚在颐和园爽玩一圈,还想去北大看看。惦记着刚刚掏着的好东西,就想问问它从颐和园到北京大学的公共交通路线。

18 分钟后,搜索终于结束了。

最后展示出的结果中,地铁,公交,自行车,步行等等情况都被考虑到了,总结的非常全面到位。

唯一的问题是世超已经在北京的春风里瑟瑟发抖了很久很久。

当然,这一点可能源自它 “ 沉思 ” 的特性,更适合解决复杂的,需要思考的问题。毕竟工具也要分使用场合,不能拿大炮轰蚊子。

不过在测试过程中,世超也确实遇到了一些其他的细节问题,会影响到使用体验

比如在网页搜索结果给出之后,有时候会等待很久,再进行点击。

对话框显示它没有在思考,但网页上也没有在操作。作为旁观者的人类,看着它卡在那里,答案也在那里,却不能上手替它点击。

简直是新时代酷刑,焦虑值瞬间拉满。

但这毕竟只是个 Beta 测试版,正式版会不会修复这些问题还不好说。

综合来看,AutoGLM 沉思作为一款免费的国产 agent 表现还是不错的,相比起 200 刀一月的 OpenAI Operator 和一码难求的 Manus,性价比真心拉满了,至少能让大家先无痛体验一下 AI 帮自己干活是个啥感觉。

听说 4 月还会开源,到时候可以再来围观一下还有什么好玩的。

撰文:莫莫莫甜甜

编辑:江江 & 面线

美编:萱萱

图片、资料来源:

莫莫实测、OpenAI-4o、AutoGLM沉思官网

Disclaimer: Investing carries risk. This is not financial advice. The above content should not be regarded as an offer, recommendation, or solicitation on acquiring or disposing of any financial products, any associated discussions, comments, or posts by author or other users should not be considered as such either. It is solely for general information purpose only, which does not consider your own investment objectives, financial situations or needs. TTM assumes no responsibility or warranty for the accuracy and completeness of the information, investors should do their own research and may seek professional advice before investing.

Most Discussed

  1. 1
     
     
     
     
  2. 2
     
     
     
     
  3. 3
     
     
     
     
  4. 4
     
     
     
     
  5. 5
     
     
     
     
  6. 6
     
     
     
     
  7. 7
     
     
     
     
  8. 8
     
     
     
     
  9. 9
     
     
     
     
  10. 10