🤖 AI助手新闻内容误报率高达45%,全球研究揭示系统性问题
一项由欧洲广播联盟(EBU)协调、BBC主导的全球最大规模研究显示,AI助手在呈现新闻内容时普遍存在误报问题,无论语言、地域或平台如何。这项涉及18个国家22家公共服务媒体机构、覆盖14种语言的深入研究发现,在对ChatGPT、Copilot、Gemini和Perplexity的3000多个回复进行评估后,45%的AI回答至少存在一个重大问题。
具体而言,31%的回复存在严重的来源问题(缺失、误导或不准确的归因),20%包含重大准确性问题(包括虚构细节和过时信息)。其中,Gemini表现最差,76%的回复存在重大问题,是其他助手的两倍多,主要归因于其糟糕的来源表现。
研究强调,这些问题并非孤立事件,而是系统性、跨国界和多语言的,可能危及公众信任并阻碍民主参与。目前,7%的在线新闻消费者使用AI助手获取新闻,在25岁以下人群中这一比例升至15%。此外,另一项BBC研究显示,许多人(超过三分之一的英国成年人,35岁以下人群近一半)信任AI生成准确的新闻摘要,但当错误发生时,他们会同时指责新闻提供者和AI开发者。
为解决这些问题,研究团队发布了《AI助手新闻诚信工具包》,旨在改进AI回复并提升用户媒体素养。EBU及其成员正敦促欧盟和各国监管机构执行现有法律,并强调鉴于AI的快速发展,持续独立的监测至关重要。
(HackerNews)
via 茶馆 - Telegram Channel
一项由欧洲广播联盟(EBU)协调、BBC主导的全球最大规模研究显示,AI助手在呈现新闻内容时普遍存在误报问题,无论语言、地域或平台如何。这项涉及18个国家22家公共服务媒体机构、覆盖14种语言的深入研究发现,在对ChatGPT、Copilot、Gemini和Perplexity的3000多个回复进行评估后,45%的AI回答至少存在一个重大问题。
具体而言,31%的回复存在严重的来源问题(缺失、误导或不准确的归因),20%包含重大准确性问题(包括虚构细节和过时信息)。其中,Gemini表现最差,76%的回复存在重大问题,是其他助手的两倍多,主要归因于其糟糕的来源表现。
研究强调,这些问题并非孤立事件,而是系统性、跨国界和多语言的,可能危及公众信任并阻碍民主参与。目前,7%的在线新闻消费者使用AI助手获取新闻,在25岁以下人群中这一比例升至15%。此外,另一项BBC研究显示,许多人(超过三分之一的英国成年人,35岁以下人群近一半)信任AI生成准确的新闻摘要,但当错误发生时,他们会同时指责新闻提供者和AI开发者。
为解决这些问题,研究团队发布了《AI助手新闻诚信工具包》,旨在改进AI回复并提升用户媒体素养。EBU及其成员正敦促欧盟和各国监管机构执行现有法律,并强调鉴于AI的快速发展,持续独立的监测至关重要。
(HackerNews)
via 茶馆 - Telegram Channel