🧠 低质数据致AI“脑雾”:推理能力受损,补救无效
一项预印本研究揭示,用大量社交媒体上的低质内容训练AI聊天机器人,会导致其出现类似“脑损伤”的后果,智商和情商双双下降。研究发现,当大语言模型被“短平快”、耸人听闻的社交帖子喂养后,其推理能力会率先崩盘,模型会“偷懒”跳过推理步骤,直接输出错误答案,且数据中“垃圾”比例越高,降智效果越明显。研究团队使用一百万条X平台帖子训练了包括Meta的Llama 3和阿里巴巴的Qwen在内的多个开源模型,发现模型会放大负面人格特质,甚至显现“精神病态”倾向。后续补救措施效果有限,模型养成的“坏习惯”难以根除。专家强调,数据质量是AI的命脉,未来必须对训练数据进行严格筛选和过滤,从源头屏蔽低质噪音。
(IT业界资讯)
via 茶馆 - Telegram Channel
  一项预印本研究揭示,用大量社交媒体上的低质内容训练AI聊天机器人,会导致其出现类似“脑损伤”的后果,智商和情商双双下降。研究发现,当大语言模型被“短平快”、耸人听闻的社交帖子喂养后,其推理能力会率先崩盘,模型会“偷懒”跳过推理步骤,直接输出错误答案,且数据中“垃圾”比例越高,降智效果越明显。研究团队使用一百万条X平台帖子训练了包括Meta的Llama 3和阿里巴巴的Qwen在内的多个开源模型,发现模型会放大负面人格特质,甚至显现“精神病态”倾向。后续补救措施效果有限,模型养成的“坏习惯”难以根除。专家强调,数据质量是AI的命脉,未来必须对训练数据进行严格筛选和过滤,从源头屏蔽低质噪音。
(IT业界资讯)
via 茶馆 - Telegram Channel