刚刚智谱推出全球首个手机通用Agent人人可用
AI 终于学会自己玩手机了!

刚刚,智谱发布了最新版的AutoGLM, 让每个人都能拥有一个会自己操作手机的AI 助手。

最为不同的是,它并不是Browser Use,也不再像旧版一样需要占用你的手机,而是 为你额外配备了另一台云端的手机,并真正成为能替你在手机上完成各种任务的智能体 。
且过程中,完全不影响你自己手机的使用。
不抢屏幕就把活干了
想象一下这个场景: 你正在地铁上刷短视频,突然想起要订明天的酒店。
往常做法是退出视频,打开携程/去哪儿一通比价,然后再去美团点评看一圈评价。整个过程你的人、手机和心智都被这事儿 完全 占用,甚至旅游还没定,人先炸毛了……
但有了AutoGLM 就会不一样。
它在 云端拥有自己的手机和电脑 ,你只需说一句话,它就能在云端开始干活并完成整个流程,而过程中,你可以继续刷你的视频,看你的小姐姐们继续热舞。
这就是AutoGLM 的 最大价值 : 不抢占你的屏幕,不打断你的操作 。
同时重要的是,移动互联网时代,很多功能只存在于手机APP 中。
银行转账的某些功能、外卖平台的优惠券、某电商平台的最低价格……这些都是网页版不能用、不好用,或有坑的。
而拥有手机的AutoGLM,让AI 从此真正进入了移动互联网的完整生态,能看见完整的数字世界了。
专属云端手机
AutoGLM 的工程实现原理很简单。
智谱与阿里云等公有云厂商合作, 为每个用户额外部署了一台专属的云手机和云电脑 。
当你发出指令时,AutoGLM 会在云端设备上执行任务。
这些云设备具备完整的手机功能: 可以安装APP、浏览网页、甚至处理文档。
这种「 平行工作 」的模式,让AI 从「 告诉你怎么做 」真正变成了「 帮你做 」。
上周日, 我有幸运参加了 智谱AutoGLM 的闭门发布会,会上智谱CEO 张鹏提到了一个观点:
未来的人才定义是全才 。
这里并不是说,你需要什么都会,而是你要学会指挥和安排AI帮手。
你要具备的能力是怎么跟这些智能体去沟通交流,让它平行地帮你完成任务。
此即AI 时代全才的新定义。
实测之帮我购物
在搞到测试资质后,我也第一时间用AutoGLM 测了一把,也顺便看看我有没有潜力能成为这种全才
下载好APP 后,顶部会有“对话”和“手机”两tab:

如果你是初次启动并快速切换至手机tab,可以看到智能体手机正在启动中;启动完成后,你还可以接管手机自己操作,在你的手机里玩另一台手机。
期间要注意保持头脑清醒,一个不小心,容易产生种套娃的错乱感

说回测试,最近我想要买个3D 打印机玩儿,于是我输入:
帮我到小红书找一下万元内的3d 打印机,要求评论区好评多,不要广告贴
(注意第一次使用小时书时,AutoGLM 会自动检测登录状态并会让用户接管云手机进行登录,然后才能继续使用)
(为了方便观看,我把竖版录频切开来再并排着放,更快、更一目了然)
AutoGLM 先是 自己打开小红书 ,搜索了「万元3D 打印机」的关键词,并自己点击看看详情,还真的按我的要求查看了评论区,看完后还自己退出,甚至还自己滚动页面查看了更多的小红书笔记。

过程 中它进行了各种输入、点击、返回、滑动等等操作,最后 提取出了万元内3D 打印机的品牌、型号、还贴心地给出了用户反馈等信息。
不得不说,背后GLM-4V 的多模态能力真是稳的一匹,完全就像是个真人。
不过,我想万元还是太贵了,就买它推荐的那台便宜点儿的纵维立方S1C 吧。于是我直接语音输入:
到拼多多帮我买一 台 纵维立方S1C 3D 打 印机
于是,AutoGLM 又自己 打开了拼多多 ,搜索“ 纵维立方S1C 3D 打印机”,并准确的点开了正确的商品、选中了型号,并, 准备付款!
不过,只是准备付款,它还是有点谨慎,这个大动作还是交给我来操作。
还是有点不够自信啊。
(但它要是真敢操作,我反而就有点不敢用了……
我还试了些其他场景:
订机票,自动选题制作素材然后发小红书、点杯瑞幸运并要求不能超过9块9还得使用代金券等等任务 它都敢干,也能干……
各种考验视力的小细节都做的很精准,比如它能精准地点击按价格排序的从低到高的小图标来为我省钱:

但所有的APP 中,涉及到付钱、确认订单、输入手机号等环节还是让我自己来。
以及,整个过程中, AutoGLM 还机智地跳过了各种诱惑的红包轰炸 (毕竟拼多多们的套路,你懂的……
当然,还可以让AutoGLM 来帮忙订机票、演唱会门票、找房子、点外卖、听歌等等……
我就不玩了,手机要没电了(此时此刻,电量仅仅只有1%,前面的截图应该也提前暴露了……
当然,作为bug 爱好者,在测试过程中我自然也是碰到了各类小bug:比如有件商品其实有货但它以为没货了(切另一个型号就有了);有个APP 让我扫脸认证时,弹出了云手机的远程摄像头,还扫到了我的脸,但一直没通过……
而值得一提的是, 这次的AutoGLM 是安卓、iOS 版和PC端全端同步上线, 拿台iPhone 就可以直接用,我不用再专门找个安卓手机了终于。
如前面介绍的,原因在于背后真实在干活的是一台远在云端的云手机( 开了无障碍模型的安卓手机 ),所以苹果手机自然也可以使用了: 不需要搞苹果手机的自动化,而只需要去控制这台云手机即可。
这确实巧妙,一下子就不是问题了,各种安卓机型头痛的适配问题(安卓程序员永恒的痛),也不存在了—— 云手机可以全都是一个型号啊!
(话说,云手机我自己就一直在用,常年有一台在玩,我怎么就没想到这一招呢……
从Agent 到AGI 的3A 原则
测完了,再来说说AutoGLM 背后的意义所在。
在闭门会中,AutoGLM 项目负责人刘潇还分享了一个重要观点:
真正的AGI需要满足「 3A原则 」。
这3A 展开来说就是:
Around-the-clock(全时) :24小时待命,即使你睡觉或设备黑屏时仍在工作。
Autonomy without interference(自运转、零干扰) :在云端独立运行,不占用你的设备资源。
Affinity(全域连接) :跳出浏览器对话框,连接手机、电脑、手表、家电等所有设备。
这个理念很有启发性。
刘潇认为,AGI 的下限是「 拥有一个能自主稳定运行24小时的AI同事 」。
它不是Copilot,而是真正的同事,能让个人的能力乘2甚至乘3。
而3A 原则,也是AutoGLM 正在践行的方向。
端到端强化学习
在AutoGLM 举重若轻的背后,实际上,则是智谱在技术上的重大突破。
在技术路线上,智谱选择了 端到端在线强化学习 。

相比冷启动,成功率提升了165%。
刘潇强调:
只要你能提供environment 和准确的reward,没有任何事情是现有算法解决不了的。
这种「 少监督、多强化 」的训练方式,让模型能够自主学习和进化。
而GLM-4.5 和GLM-4.5V 从预训练第一天就面向Agent 任务优化,这是它们能够在复杂任务上表现出色的关键。
在Computer Use(OSWorld)基准测试中,AutoGLM 达到了 48.1分 ,显著超越ChatGPT Agent 和Claude.

而更为关键的是成本控制——
传统基于API 的Agent 单次成本约3-5美元,而AutoGLM 仅需 0.2美元 ,正在接近Google 搜索的成本量级。
相信很快就能降到同一水平,不要钱的AI 时代正在来临。
互联网新流量
另一个有趣的洞察是,AutoGLM 的Agent,还代表着 全新的互联网流量 。
过去几年互联网行业所谓的创新和竞争,说白了(很大程度上)是在行业内卷——
用户的时间是有限的,已经打满了 。
许多所谓的创新并没有创造价值,只是打击到了友商而已。这也是传统APP 们在这场零和游戏中的困境之所在。
但Agent 不同,它可以彻夜工作:选明天的三餐、做背景调研、准备会议材料……等等
这种流量是 带着成交意图的高质量流量 。
且并不是在那瞎跑,而是真实的在创造价值。
Agent 的单任务平均消耗达到256K Token,是普通对话的32倍。
这一方面是对推理基础设施巨大挑战,但更重要的是, 这意味着巨大的新商业机会。
人人都将成为领导
张鹏还分享了一个观点:
每个人都会变成领导,而不是打工仔 。
未来,我们将人人都有一堆AI 打工仔,关键不再是自己的实干技巧,而是 怎么组织它们,让它们为自己工作,把它们集合起来解决有价值的关键问题。
这种能力比你自己的专业技能更重要,因为AI 在很多专业能力上已经超出普通人的平均水平。
AutoGLM 的发布,也让这个愿景变得更有可能。
它不是让你学会所有技能,而是让你学会如何指挥那些比你更专业的各类AI智能体。
从而,我们得以让自己从执行中释放出来,有更多的时间去思考。
每个人都将成为它们的领导,成为真正意义上的CEO!

这将从今天开始,从握在你手中的实体手机背后的云手机开始,从你点开AutoGLM 开始,从拥有一个自主执行能力的智能伙伴开始。
当然,可以不止一个,也可以是一群。
只要你领导得过来。
或许, AGI 的最终形态不是AutoGLM 现在的样子,但智谱在众多路线中,坚定而无畏地走出了这一步。
[1]
App 下载: 小米、荣耀应用商店搜索AutoGLM或点击链接https://autoglm.zhipuai.cn/htdocs/download.html
[2]
版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/110.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论