AI游戏新尝试:Gemini挑战《宝可梦:蓝》

Gemini的分工机制与操作逻辑
在本次测试中,Gemini AI通过接收玩家当前所处位置、地图结构以及系统操作指令等信息,尝试自主决策游戏进程。研究人员将AI分为多个实例模块,分别承担不同职责,例如游戏操控、战术分析和技术咨询等角色。
这些模块之间相互协作,比如负责操作的分身会在遇到复杂战斗或路径选择时,向技术顾问模块“请教”,从而形成一种类似人类团队合作的推理流程。

两次成功通关的不同表现
在实验过程中,Gemini的两个版本均完成了《宝可梦:蓝》的通关挑战。其中,Gemini 2.5 Pro Experimental版本在有人类技术员提供少量辅助推理的前提下,耗时813小时完成通关;而Gemini 2.5 Pro Preview 05-06则完全依靠自身探索,在406.5小时内顺利完成游戏。
值得注意的是,首次低版本测试因频繁出错和重复尝试导致时间异常漫长,显示出AI在逻辑判断上的局限性。
AI的优势与短板明显
尽管Gemini在信息检索和快速反应方面展现出强大能力,但在面对需要长期规划和灵活应变的情境时,依然暴露出明显的逻辑缺陷。例如在地图导航中多次出现“原地绕圈”的情况,甚至在面对简单谜题时也会陷入长时间停滞。
这表明,当前的人工智能在理解游戏语境、制定战略层面的决策上,仍有很长的路要走。



























