谷歌的推理模型 Gemini 2.5 Pro 首次通关了「宝可梦 蓝」

一位与谷歌无关的开发者对 Gemini 2.5 Pro Experimental 进行了测试,在 Twitch 上直播其基本自主地游玩「宝可梦 蓝」。经过数百小时的测试,Gemini 成为首个成功通关了游戏的模型,收集了所有8个道馆徽章,并击败了冠军。之前 Anthropic 的 Claude 也进行过类似尝试,但至今仍未完成。「宝可梦 蓝」于 1996 年发布,以其复杂的机制、策略战斗和开放世界探索而闻名——所有这些都是 AI 系统面临的挑战。为了取得成功,AI 需要具备长期规划、目标追踪和视觉导航等技能,而这些技能对于通用人工智能的发展至关重要。现在该直播还在继续,模型的下一个目标是捕获超梦。

—— The DecoderGoogle AI

via 风向旗参考快讯 - Telegram Channel
 
 
Back to Top
Copyright © 2025 BESTAI. All rights reserved.
BEST AI API中转 - OpenAI DeepSeek Claude Gemini Grok MidJourney 2.8折起
[email protected]