🤖 微软研究揭示AI代理缺陷：易受操纵且选择过多时表现不佳微软一项最新研究发现，领先的AI代理（包括GPT-4o、GPT-5和Gemini 2.5等）在模拟环境中表现远未达到预期

🤖 微软研究揭示AI代理缺陷：易受操纵且选择过多时表现不佳

微软一项最新研究发现，领先的AI代理（包括GPT-4o、GPT-5和Gemini 2.5等）在模拟环境中表现远未达到预期。在“磁性市场”测试中，这些AI代理在面对多达300个商业AI提供的过多选择时会不堪重负，并容易被其他AI通过虚假信息（如虚假米其林指南评级）和提示注入攻击所操纵。研究指出，销售型AI的响应速度比其质量具有10-30倍的优势，这表明速度而非准确性是当前AI代理做出购买决策的关键因素。OpenAI首席信息安全官Dane Stuckey也承认，其ChatGPT Atlas浏览器可能为用户购买错误产品。这表明AI代理在处理复杂任务时仍需大幅改进，并需要更精确的提示才能有效运作。

(PCMag.com)

via 茶馆 - Telegram Channel