DeepSeek 因华为芯片问题推迟新 AI 模型发布据三位知情人士透露，中国人工智能公司 DeepSeek 因未能在华为昇腾芯片上成功训练其 R2 模型，而推迟了该模型的发布

DeepSeek 因华为芯片问题推迟新 AI 模型发布

据三位知情人士透露，中国人工智能公司 DeepSeek 因未能在华为昇腾芯片上成功训练其 R2 模型，而推迟了该模型的发布。此前在今年 1 月推出 R1 模型后，有关部门鼓励公司改用华为系统替代英伟达系统。训练问题导致原定 5 月的发布推迟，并使 DeepSeek 在竞争中落后。消息人士称，华为曾派工程师协助，但未能完成一次成功的训练运行。DeepSeek 仍在与华为合作，使该模型在推理阶段与华为芯片兼容。

“模型是可以轻易替换的商品，”加州大学伯克利分校人工智能研究员 Ritwik Gupta 表示，并指出阿里巴巴的通义千问 Qwen3 等竞争对手更高效地采用了 DeepSeek 的核心推理算法。Gupta 补充称，华为在昇腾芯片的训练上正经历“成长的阵痛”，但预计会逐步适应。DeepSeek 和华为对此均未置评。

来源：金融时报

via LoopDNS资讯播报 - Telegram Channel