近日,《华盛顿邮报》的科技专栏作家 Geoffrey A. Fowler 分享了一次颇为惊险的经历,他将自己十年来在 Apple Watch 上记录的健康数据导入到 OpenAI 最新推出的 ChatGPT Health 功能中,结果却被错误地判定心脏健康为 “不及格”(F)。这一结果让 Fowler 感到恐慌,他随即联系了医生进行进一步检查。
经过详细的医疗评估,医生明确表示 Fowler 的心脏健康状况极佳,心脏病发作的风险非常低,甚至不需要进行额外的有氧适能测试。这一番反转让 Fowler 松了口气,但同时也引发了他对 AI 健康评估准确性的质疑。
深入分析后,Fowler 发现 ChatGPT 的误判主要源于对数据的错误解读。AI 将 Apple Watch 记录的 VO2max(最大摄氧量)视为绝对准确的医疗数据,而实际上,苹果公司早已说明这一数据仅为 “估算值”,其主要用途在于跟踪健康趋势,而非提供临床诊断。此外,Fowler 在更换新款 Apple Watch 后,由于传感器升级而导致的静息心率基准变化,AI 也错误地将其解读为生理机能的显著变化,完全忽略了硬件更新的关键因素。
更为棘手的是,ChatGPT Health 在反馈结果时表现出明显的不稳定性。当 Fowler 多次询问同一健康问题时,AI 的评分在 “F” 到 “B” 之间剧烈波动,令人难以置信。此外,该系统似乎还出现了 “健忘症”,在对话中多次遗忘 Fowler 的性别和年龄等基本信息,甚至在拥有最近血液检测报告的情况下,依然选择性地忽略这些重要的临床证据。
Fowler 的这一经历提醒我们,在利用 AI 技术进行健康评估时,务必保持警惕,毕竟 AI 的判断并非总是可靠。
via AI新闻资讯 (author: AI Base)