GPT5正以o3的三倍速度打宝可梦现已抵达冠军之路直播进行中
GPT-5正在直播打宝可梦,而且速度比o3快三倍!
就在刚刚,GPT-5已经抵达了冠军之路(Victory Road),这是挑战四天王前的最后一关。
更让人惊讶的是速度——
GPT-5只用了 6105步 就到达这里,而o3需要 16882步 ,速度几乎快了三倍。
为什么GPT-5能这么快呢?
这个项目的发起者Clad3815(@Clad3815)在实时测试中发现了几个关键差异:
GPT-5的幻觉比o3少得多,这是速度提升的主要原因。
GPT-5不会像o3那样频繁地「 看错 」游戏画面,做出错误的判断。
在游戏中,一个错误的判断可能导致走错路、撞墙,甚至陷入死循环。
空间推理能力的巨大提升 也是关键。
o3经常试图暴力穿墙,在复杂区域导航时困难重重。而GPT-5能够规划长序列的输入指令,几乎不出错,这节省了大量时间。
想象一下,o3 就像一个在迷宫里摸着墙壁前进的愣头青,不断碰壁回头;而GPT-5则是站在高处俯瞰全局,规划好路线后一气呵成。
更重要的是,GPT-5在 制定目标和执行计划 上表现更好。它知道自己要做什么,怎么做,不会像无头苍蝇一样乱转。
这里介绍一下直播内容:
这是一个独立开发者Clad3815创建的AI游戏实验——
GPT-5完全独立运行宝可梦红版,没有任何人类干预,每一个决策都由AI自主完成。

目前直播已经进行了 整整9个小时 ,GPT-5正在华蓝洞穴(Cerulean Cave)狩猎超梦(MEWTWO)。
直播间有超过 2000名关注者 ,实时观看人数保持在百人以上。
技术上,这个系统通过读取游戏RAM中的基础瓦片颜色数据,让AI能够实时生成小地图。AI可以在地图上放置emoji标记来记住关键位置,比如门、物品或事件。
这种空间记忆系统类似于人类玩家在游戏中建立的心理地图。

观众不仅可以实时观看GPT-5的决策过程,还能参与给宝可梦起昵称,与AI互动。
Daniil Sedov(@GusarichOnX)询问使用了什么推理强度,Clad3815回复说用的是 high 级别。
高推理强度意味着GPT-5在每一步决策时都会进行更深入的思考,虽然单步耗时更长,但 总体效率反而更高,因为错误更少。
怎么说呢,高是高,就是有点费钱……

而OpenAI的总裁兼联合创始人Greg Brockman也转发了这个实验并为GPT-5点赞:
gpt-5 plays Pokémon — 3x faster progress than o3

softclone(@Softclone)则提出了一个有趣的想法:
太棒了,现在用gpt-5-mini再跑一遍,配一个子智能体来总结聊天内容并给玩家智能体反馈和提示。聊天会注入速通策略,会更厉害
在我看来,这个实验倒也不只是玩玩游戏那么简单。
宝可梦红版作为一个复杂的RPG游戏,需要理解游戏规则、记住地图布局、制定战斗策略、管理资源……
这对AI 的综合能力可以说是极大的考验。
而值得注意的是:
GPT-5能够在游戏中完成更强的空间推理、表现出更好的规划能力,核心在于其拥有极低的幻觉率。
这对写个故事、哄你开心可能没什么用,但在自动驾驶、项目管理、医疗诊断等等的 现实场景中,GPT-5 或可能将发挥极大的实际作用。
版权声明:
作者:shadowrocket
链接:https://www.shadowrocket9.top/115.html
来源:Shadowrocket官网
文章版权归作者所有,未经允许请勿转载。


共有 0 条评论