谷歌的推理模型 Gemini 2.5 Pro 首次通关了「宝可梦蓝」一位与谷歌无关的开发者对 Gemini 2.5 Pro Experimental 进行了测试，在 Twitch 上直播其基本自主地游玩「宝可梦蓝」

谷歌的推理模型 Gemini 2.5 Pro 首次通关了「宝可梦蓝」

一位与谷歌无关的开发者对 Gemini 2.5 Pro Experimental 进行了测试，在 Twitch 上直播其基本自主地游玩「宝可梦蓝」。经过数百小时的测试，Gemini 成为首个成功通关了游戏的模型，收集了所有8个道馆徽章，并击败了冠军。之前 Anthropic 的 Claude 也进行过类似尝试，但至今仍未完成。「宝可梦蓝」于 1996 年发布，以其复杂的机制、策略战斗和开放世界探索而闻名——所有这些都是 AI 系统面临的挑战。为了取得成功，AI 需要具备长期规划、目标追踪和视觉导航等技能，而这些技能对于通用人工智能的发展至关重要。现在该直播还在继续，模型的下一个目标是捕获超梦。

—— The Decoder，Google AI

via 风向旗参考快讯 - Telegram Channel