实测首个手机通用 Agent:点外卖、做 PPT,连工作都能帮我找

日期:2025-08-22 18:20:23 / 人气:3


每天睁眼第一件事是刷手机,睡前最后一件事还是刷手机。但你有没有算过,每天要在不同 App 之间切换多少次?淘宝比价、美团点外卖、小红书找攻略…… 我们的手机里装着几十个 App,却要靠十个手指在它们之间来回奔波。这些碎片化的时间累积下来,常常让人不禁疑惑:时间都去哪儿了?
所以当 AI Agent 浪潮席卷而来时,我们迫切希望能有一个真正的手机通用 Agent。它应该像一个随身助理,随时响应需求,在后台默默工作,不打断正在进行的任何事情。其实早在 Manus 刷屏之前,智谱就已在 Agent 赛道深耕。我们之前测过他们的初代 AutoGLM,印象不错。而就在刚刚,智谱再次升级了 AutoGLM Agent 功能。带着对 “手机自动驾驶” 概念能否实现的疑问,我们对这款 Agent 进行了实测。
一句话开启手机自动驾驶,多场景操作不在话下
据智谱官方介绍,AutoGLM Agent 支持一句话实现 “云端操作 + 自动执行”。简单来说,就是给你配一台云手机和云电脑,你说话,它干活。你只需通过自然语言发布指令,AutoGLM 就能在云设备上自动完成各种任务:打开 App、浏览网页、点外卖、订酒店、制作 PPT 和网页、生成视频,甚至可以在多个 App 间协同操作。由于所有任务都在云端执行,既不占用手机或电脑资源,也不打断正在进行的操作。打个比方,Chatbot 告诉你 “怎么做”,AutoGLM 直接 “帮你做”。
不过,目前市面上没有完美的 AI 产品,整体体验下来,AutoGLM 偶尔还是会犯迷糊,稳定性有待提升,且目前仅支持部分预装应用。虽然理解这种安全性限制,但确实有点 “不够野”。
超话定时打卡的难受,追星人深有体会。“帮我给赵露思的微博(注释:目前已注销)超话打卡”—— 老实说,我就是想看看它能否理解这个植根于中文互联网文化的需求。结果它准确定位到超话页面,完成了任务需求,说明这个 Agent 真的 “混” 过中文互联网,知道什么是超话,懂粉丝的日常。这种文化密码,国外 AI 很难学到。
分享一个小 tips,要想体验更丝滑,建议提前完成账号登录。实测中发现,部分应用的登录状态可能没法长期保存,这是一个小小的痛点。
追星之外,我还把它用在了游戏场景里。最近,痴迷于王者荣耀的我用杨戬打上了王者,但打巅峰赛时已感觉吃力,需要 “偷师学艺”。于是我让 AutoGLM Agent 帮我在 B 站找到热度较高的博主,它很快理解语境和意图,找到了合适的博主,效率拉满。
再比如追番,《凡人修仙传》国漫备受关注。前几天韩立结婴的消息一出,观看人数太多导致 B 站崩溃,虽然作为没 VIP 的散修被拦在 “护宗大阵” 门外,但我还是想在预告里发弹幕 “恭贺韩天尊结婴”,主打仪式感。而这整个过程都交给了 AutoGLM Agent 解决。
但如果 Agent 只能执行单一任务,意义并不大。真正有价值的是能否执行复杂的长链路任务,所以我们继续加大测试强度。“先打开 QQ 音乐,播放我的收藏里的第一首歌,接着打开小红书搜索贵州黄果树瀑布旅游攻略,找到收藏最多的图文笔记,点赞并收藏,然后关注发布这个笔记的博主”。这是跨越 2 个 App 的十几个操作,按以往经验,很可能在某个环节掉链子。但实测结果中,整个流程一气呵成,几乎没有任何卡顿,这才是 Agent 该有的样子。
在生活里,它同样能带来小惊喜。上班喝奶茶是打工人的倔强,AutoGLM 能准确理解 “蜜雪冰城的杨枝甘露” 这个需求,这已超过我对现阶段 AI 的期待,因为这不是简单的文字识别,而是需要理解品牌、产品类别。
再比如,让它 “在京东搜索最新款的 AirPods Pro 并收藏”,结果它不仅准确找到商品,还贴心地停留在详情页让我确认价格。这种细节把控,像极了资深代购。
工作场景同样给力,省心又高效
聊完生活化场景,再回到打工人的主业 —— 工作。显然,在手机上处理复杂任务并不合适,真正的生产力工具还是得看电脑。而在内容创作方面,这款 Agent 同样表现不俗(体验地址:autoglm.zhipuai.cn)。
我抛出第一个需求:“我是一名语文老师,下节课要给学生讲解《将进酒》,帮我制作一份课件”。生成的 PPT 包含诗歌全文、作者背景、诗歌赏析等内容,排版和审美都很出色。过去几年我体验过不少 AI 一键生成 PPT 的功能,这款 Agent 的作品让人眼前一亮,值得厂商们借鉴。或许是因为审美要求更高,其生成速度比常见的 AI PPT 工具慢一些,但对老师来说,能省下备课时间,这点等待完全值得。
还记得 ChatGPT Agent 刚上线时,不少网友用它发了第一条小红书。那这款网页端 Agent 能做到吗?“用宫崎骏吉卜力风格画一座漂浮在云端的城市,孩子们骑着飞行鲸鱼穿梭其中,然后将这张图片发表在小红书”。生成效果很棒,色彩温和,构图有诗意,确实有吉卜力动画的感觉。虽然细节上达不到宫崎骏本人的水准,但对一般用户来说,质量已经完全够用。此外,它还会自动配上文案、标题,不过最终发布需要本人确认,这种从创作到发布的一条龙服务,对内容创作者来说非常实用。
AutoGLM 背后是智谱的 GLM-4.5 和 GLM-4.5V 模型,其在推理、代码、智能体等综合能力上达到开源 SOTA,意味着能满足一些技术需求。我抛出高难度任务:“搭建一个交互式网站,用户在网页左侧输入想要描绘的场景,在右侧下拉菜单中选择艺术流派(如巴洛克、像素风、蒸汽波或敦煌壁画),点击生成后,页面将呈现对应风格的场景插画或海报,并同时展示该流派的简要发展脉络及代表性艺术家。” 作为代码小白,我没指望做出媲美专业团队的作品,但 AutoGLM 打造一个能跑通的原型产品,已经基本绰绰有余。
还有一个更有趣的场景:既然 AutoGLM 能帮写稿、做图、处理琐事,我干脆让它帮我找工作。这款 Agent 由智谱开发,我便用它向智谱 AI 发出求职申请。
总结:开启 “动口不动手” 新时代
体验下来,AutoGLM 给我的感觉,更像是希腊神话中由工匠之神赫淮斯托斯创造的青铜巨人 —— 塔罗斯,它肩负着守护克里特岛的神圣使命,每天绕岛巡逻三次,一旦发现威胁就会投掷巨石驱逐入侵者 —— 无需任何人类干预就能忠实履行职责。
其实早在去年,AutoGLM 就凭借 “能操作手机的 Agent” 火了一把。只是这次更新后,它彻底进化成了一个真正人人能用的手机 Agent。
划重点:这是全球第一个手机通用 Agent。怎么理解这个 “通用”?以前的 AI 助手只能在特定 App 里帮忙,AutoGLM 可以直接操控整个手机系统。看小说、订外卖、购物等日常操作它都能一手包办。同时据智谱官方剧透,AutoGLM 将很快上线 “定时任务” 功能,让 AI 每天主动干活。
而且这是第一个真正面向普通人的 Agent,Manus 在海外市场虽火爆但有一定体验门槛,相比之下,AutoGLM 选择了另一条路:用自研的 GLM-4.5 模型,让国内用户有机会真切感受到什么是 “既会思考,又能执行” 的 AI 助手。
数据最有说服力。基准测试结果显示,AutoGLM 在 Computer Use(OSWorld)中达到 48.1 分,显著超越 Operator;而在 Browser Use(WebVoyager)中,AutoGLM 的得分也达到 87.7。
当然,AutoGLM 现在还有一些限制,但即便如此,它已经足以胜任那些占据我们大量时间的日常操作。当智谱与一些手机厂商达成更系统级的合作后,这个 Agent 的想象空间将彻底打开,成为我们真正期待的数字助理。
甚至不必等到那一天,现在的 AutoGLM 已经足够聪明,你可以把一些 “数字苦力活” 打包扔给它,腾出手做点更有趣的事。与此同时,我们也终于迎来了真正 “动口不动手” 的时代。
附 AutoGLM 下载地址:https://autoglm.zhipuai.cn/htdocs/download.html

作者:杏耀注册登录测速平台




现在致电 8888910 OR 查看更多联系方式 →

COPYRIGHT © 杏耀注册登录测速平台 版权所有