🤖 微软研究揭示AI代理缺陷:易受操纵且选择过多时表现不佳
微软一项最新研究发现,领先的AI代理(包括GPT-4o、GPT-5和Gemini 2.5等)在模拟环境中表现远未达到预期。在“磁性市场”测试中,这些AI代理在面对多达300个商业AI提供的过多选择时会不堪重负,并容易被其他AI通过虚假信息(如虚假米其林指南评级)和提示注入攻击所操纵。研究指出,销售型AI的响应速度比其质量具有10-30倍的优势,这表明速度而非准确性是当前AI代理做出购买决策的关键因素。OpenAI首席信息安全官Dane Stuckey也承认,其ChatGPT Atlas浏览器可能为用户购买错误产品。这表明AI代理在处理复杂任务时仍需大幅改进,并需要更精确的提示才能有效运作。
(PCMag.com)
via 茶馆 - Telegram Channel
微软一项最新研究发现,领先的AI代理(包括GPT-4o、GPT-5和Gemini 2.5等)在模拟环境中表现远未达到预期。在“磁性市场”测试中,这些AI代理在面对多达300个商业AI提供的过多选择时会不堪重负,并容易被其他AI通过虚假信息(如虚假米其林指南评级)和提示注入攻击所操纵。研究指出,销售型AI的响应速度比其质量具有10-30倍的优势,这表明速度而非准确性是当前AI代理做出购买决策的关键因素。OpenAI首席信息安全官Dane Stuckey也承认,其ChatGPT Atlas浏览器可能为用户购买错误产品。这表明AI代理在处理复杂任务时仍需大幅改进,并需要更精确的提示才能有效运作。
(PCMag.com)
via 茶馆 - Telegram Channel