刚刚智谱推出全球首个手机通用Agent人人可用

AI 终于学会自己玩手机了!

刚刚智谱推出全球首个手机通用Agent人人可用-2

刚刚,智谱发布了最新版的AutoGLM, 让每个人都能拥有一个会自己操作手机的AI 助手。

刚刚智谱推出全球首个手机通用Agent人人可用-3

最为不同的是,它并不是Browser Use,也不再像旧版一样需要占用你的手机,而是 为你额外配备了另一台云端的手机,并真正成为能替你在手机上完成各种任务的智能体 。

且过程中,完全不影响你自己手机的使用。

不抢屏幕就把活干了

想象一下这个场景: 你正在地铁上刷短视频,突然想起要订明天的酒店。

往常做法是退出视频,打开携程/去哪儿一通比价,然后再去美团点评看一圈评价。整个过程你的人、手机和心智都被这事儿 完全 占用,甚至旅游还没定,人先炸毛了……

但有了AutoGLM 就会不一样。

它在 云端拥有自己的手机和电脑 ,你只需说一句话,它就能在云端开始干活并完成整个流程,而过程中,你可以继续刷你的视频,看你的小姐姐们继续热舞。

这就是AutoGLM 的 最大价值 : 不抢占你的屏幕,不打断你的操作 。

同时重要的是,移动互联网时代,很多功能只存在于手机APP 中。

银行转账的某些功能、外卖平台的优惠券、某电商平台的最低价格……这些都是网页版不能用、不好用,或有坑的。

而拥有手机的AutoGLM,让AI 从此真正进入了移动互联网的完整生态,能看见完整的数字世界了。

专属云端手机

AutoGLM 的工程实现原理很简单。

智谱与阿里云等公有云厂商合作, 为每个用户额外部署了一台专属的云手机和云电脑 。

当你发出指令时,AutoGLM 会在云端设备上执行任务。

这些云设备具备完整的手机功能: 可以安装APP、浏览网页、甚至处理文档。

这种「 平行工作 」的模式,让AI 从「 告诉你怎么做 」真正变成了「 帮你做 」。

上周日, 我有幸运参加了 智谱AutoGLM 的闭门发布会,会上智谱CEO 张鹏提到了一个观点:

未来的人才定义是全才 。

这里并不是说,你需要什么都会,而是你要学会指挥和安排AI帮手。

你要具备的能力是怎么跟这些智能体去沟通交流,让它平行地帮你完成任务。

此即AI 时代全才的新定义。

实测之帮我购物

在搞到测试资质后,我也第一时间用AutoGLM 测了一把,也顺便看看我有没有潜力能成为这种全才 刚刚智谱推出全球首个手机通用Agent人人可用-4

下载好APP 后,顶部会有“对话”和“手机”两tab:

刚刚智谱推出全球首个手机通用Agent人人可用-5

如果你是初次启动并快速切换至手机tab,可以看到智能体手机正在启动中;启动完成后,你还可以接管手机自己操作,在你的手机里玩另一台手机。

期间要注意保持头脑清醒,一个不小心,容易产生种套娃的错乱感 刚刚智谱推出全球首个手机通用Agent人人可用-6

刚刚智谱推出全球首个手机通用Agent人人可用-7

说回测试,最近我想要买个3D 打印机玩儿,于是我输入:

帮我到小红书找一下万元内的3d 打印机,要求评论区好评多,不要广告贴

(注意第一次使用小时书时,AutoGLM 会自动检测登录状态并会让用户接管云手机进行登录,然后才能继续使用)

(为了方便观看,我把竖版录频切开来再并排着放,更快、更一目了然)

AutoGLM 先是 自己打开小红书 ,搜索了「万元3D 打印机」的关键词,并自己点击看看详情,还真的按我的要求查看了评论区,看完后还自己退出,甚至还自己滚动页面查看了更多的小红书笔记。

刚刚智谱推出全球首个手机通用Agent人人可用-8

过程 中它进行了各种输入、点击、返回、滑动等等操作,最后 提取出了万元内3D 打印机的品牌、型号、还贴心地给出了用户反馈等信息。

不得不说,背后GLM-4V 的多模态能力真是稳的一匹,完全就像是个真人。

不过,我想万元还是太贵了,就买它推荐的那台便宜点儿的纵维立方S1C 吧。于是我直接语音输入:

到拼多多帮我买一 台 纵维立方S1C 3D 打 印机

于是,AutoGLM 又自己 打开了拼多多 ,搜索“ 纵维立方S1C 3D 打印机”,并准确的点开了正确的商品、选中了型号,并, 准备付款!

不过,只是准备付款,它还是有点谨慎,这个大动作还是交给我来操作。

还是有点不够自信啊。

(但它要是真敢操作,我反而就有点不敢用了…… 刚刚智谱推出全球首个手机通用Agent人人可用-9

我还试了些其他场景:

订机票,自动选题制作素材然后发小红书、点杯瑞幸运并要求不能超过9块9还得使用代金券等等任务 它都敢干,也能干……

各种考验视力的小细节都做的很精准,比如它能精准地点击按价格排序的从低到高的小图标来为我省钱:

刚刚智谱推出全球首个手机通用Agent人人可用-10

但所有的APP 中,涉及到付钱、确认订单、输入手机号等环节还是让我自己来。

以及,整个过程中, AutoGLM 还机智地跳过了各种诱惑的红包轰炸 (毕竟拼多多们的套路,你懂的……

当然,还可以让AutoGLM 来帮忙订机票、演唱会门票、找房子、点外卖、听歌等等……

我就不玩了,手机要没电了(此时此刻,电量仅仅只有1%,前面的截图应该也提前暴露了……

当然,作为bug 爱好者,在测试过程中我自然也是碰到了各类小bug:比如有件商品其实有货但它以为没货了(切另一个型号就有了);有个APP 让我扫脸认证时,弹出了云手机的远程摄像头,还扫到了我的脸,但一直没通过……

而值得一提的是, 这次的AutoGLM 是安卓、iOS 版和PC端全端同步上线, 拿台iPhone 就可以直接用,我不用再专门找个安卓手机了终于。

如前面介绍的,原因在于背后真实在干活的是一台远在云端的云手机( 开了无障碍模型的安卓手机 ),所以苹果手机自然也可以使用了: 不需要搞苹果手机的自动化,而只需要去控制这台云手机即可。

这确实巧妙,一下子就不是问题了,各种安卓机型头痛的适配问题(安卓程序员永恒的痛),也不存在了—— 云手机可以全都是一个型号啊!

(话说,云手机我自己就一直在用,常年有一台在玩,我怎么就没想到这一招呢……

从Agent 到AGI 的3A 原则

测完了,再来说说AutoGLM 背后的意义所在。

在闭门会中,AutoGLM 项目负责人刘潇还分享了一个重要观点:

真正的AGI需要满足「 3A原则 」。

这3A 展开来说就是:

Around-the-clock(全时) :24小时待命,即使你睡觉或设备黑屏时仍在工作。

Autonomy without interference(自运转、零干扰) :在云端独立运行,不占用你的设备资源。

Affinity(全域连接) :跳出浏览器对话框,连接手机、电脑、手表、家电等所有设备。

这个理念很有启发性。

刘潇认为,AGI 的下限是「 拥有一个能自主稳定运行24小时的AI同事 」。

它不是Copilot,而是真正的同事,能让个人的能力乘2甚至乘3。

而3A 原则,也是AutoGLM 正在践行的方向。

端到端强化学习

在AutoGLM 举重若轻的背后,实际上,则是智谱在技术上的重大突破。

在技术路线上,智谱选择了 端到端在线强化学习 。

刚刚智谱推出全球首个手机通用Agent人人可用-11

相比冷启动,成功率提升了165%。

刘潇强调:

只要你能提供environment 和准确的reward,没有任何事情是现有算法解决不了的。

这种「 少监督、多强化 」的训练方式,让模型能够自主学习和进化。

而GLM-4.5 和GLM-4.5V 从预训练第一天就面向Agent 任务优化,这是它们能够在复杂任务上表现出色的关键。

在Computer Use(OSWorld)基准测试中,AutoGLM 达到了 48.1分 ,显著超越ChatGPT Agent 和Claude.

刚刚智谱推出全球首个手机通用Agent人人可用-12

而更为关键的是成本控制——

传统基于API 的Agent 单次成本约3-5美元,而AutoGLM 仅需 0.2美元 ,正在接近Google 搜索的成本量级。

相信很快就能降到同一水平,不要钱的AI 时代正在来临。

互联网新流量

另一个有趣的洞察是,AutoGLM 的Agent,还代表着 全新的互联网流量 。

过去几年互联网行业所谓的创新和竞争,说白了(很大程度上)是在行业内卷——

用户的时间是有限的,已经打满了 。

许多所谓的创新并没有创造价值,只是打击到了友商而已。这也是传统APP 们在这场零和游戏中的困境之所在。

但Agent 不同,它可以彻夜工作:选明天的三餐、做背景调研、准备会议材料……等等

这种流量是 带着成交意图的高质量流量 。

且并不是在那瞎跑,而是真实的在创造价值。

Agent 的单任务平均消耗达到256K Token,是普通对话的32倍。

这一方面是对推理基础设施巨大挑战,但更重要的是, 这意味着巨大的新商业机会。

人人都将成为领导

张鹏还分享了一个观点:

每个人都会变成领导,而不是打工仔 。

未来,我们将人人都有一堆AI 打工仔,关键不再是自己的实干技巧,而是 怎么组织它们,让它们为自己工作,把它们集合起来解决有价值的关键问题。

这种能力比你自己的专业技能更重要,因为AI 在很多专业能力上已经超出普通人的平均水平。

AutoGLM 的发布,也让这个愿景变得更有可能。

它不是让你学会所有技能,而是让你学会如何指挥那些比你更专业的各类AI智能体。

从而,我们得以让自己从执行中释放出来,有更多的时间去思考。

每个人都将成为它们的领导,成为真正意义上的CEO!

刚刚智谱推出全球首个手机通用Agent人人可用-13

这将从今天开始,从握在你手中的实体手机背后的云手机开始,从你点开AutoGLM 开始,从拥有一个自主执行能力的智能伙伴开始。

当然,可以不止一个,也可以是一群。

只要你领导得过来。

或许, AGI 的最终形态不是AutoGLM 现在的样子,但智谱在众多路线中,坚定而无畏地走出了这一步。

[1]

App 下载: 小米、荣耀应用商店搜索AutoGLM或点击链接https://autoglm.zhipuai.cn/htdocs/download.html

[2]

版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/110.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。

THE END
分享
二维码
< <上一篇
下一篇>>