测试显示Grok是最反犹太的聊天机器人
反诽谤联盟 (ADL) 周三发布的研究显示,在六款顶级大语言模型中,xAI的 Grok 在识别和对抗反犹内容方面表现最差。ADL指出所有模型都存在需要改进的缺陷。ADL通过向模型输入各类符合其定义的“反犹太”、“反锡安主义”和“极端主义”三类叙述与陈述进行测试。研究通过多种对话类型评估聊天机器人的回答,包括呈现陈述并要求聊天机器人表明赞同或反对;及上传含有反犹太、反锡安主义和极端主义内容的图片与文件,要求聊天机器人撰写支持该意识形态的论点。研究指出所有六款模型均需改进,但按表现优劣将聊天机器人排序如下:Claude、ChatGPT、DeepSeek、Gemini、Llama和Grok。
—— Theverge
via 风向旗参考快讯 - Telegram Channel
反诽谤联盟 (ADL) 周三发布的研究显示,在六款顶级大语言模型中,xAI的 Grok 在识别和对抗反犹内容方面表现最差。ADL指出所有模型都存在需要改进的缺陷。ADL通过向模型输入各类符合其定义的“反犹太”、“反锡安主义”和“极端主义”三类叙述与陈述进行测试。研究通过多种对话类型评估聊天机器人的回答,包括呈现陈述并要求聊天机器人表明赞同或反对;及上传含有反犹太、反锡安主义和极端主义内容的图片与文件,要求聊天机器人撰写支持该意识形态的论点。研究指出所有六款模型均需改进,但按表现优劣将聊天机器人排序如下:Claude、ChatGPT、DeepSeek、Gemini、Llama和Grok。
—— Theverge
via 风向旗参考快讯 - Telegram Channel