DeepSeek 因华为芯片问题推迟新 AI 模型发布
据三位知情人士透露,中国人工智能公司 DeepSeek 因未能在华为昇腾芯片上成功训练其 R2 模型,而推迟了该模型的发布。此前在今年 1 月推出 R1 模型后,有关部门鼓励公司改用华为系统替代英伟达系统。训练问题导致原定 5 月的发布推迟,并使 DeepSeek 在竞争中落后。消息人士称,华为曾派工程师协助,但未能完成一次成功的训练运行。DeepSeek 仍在与华为合作,使该模型在推理阶段与华为芯片兼容。
“模型是可以轻易替换的商品,”加州大学伯克利分校人工智能研究员 Ritwik Gupta 表示,并指出阿里巴巴的通义千问 Qwen3 等竞争对手更高效地采用了 DeepSeek 的核心推理算法。Gupta 补充称,华为在昇腾芯片的训练上正经历“成长的阵痛”,但预计会逐步适应。DeepSeek 和华为对此均未置评。
来源:金融时报
via LoopDNS资讯播报 - Telegram Channel
据三位知情人士透露,中国人工智能公司 DeepSeek 因未能在华为昇腾芯片上成功训练其 R2 模型,而推迟了该模型的发布。此前在今年 1 月推出 R1 模型后,有关部门鼓励公司改用华为系统替代英伟达系统。训练问题导致原定 5 月的发布推迟,并使 DeepSeek 在竞争中落后。消息人士称,华为曾派工程师协助,但未能完成一次成功的训练运行。DeepSeek 仍在与华为合作,使该模型在推理阶段与华为芯片兼容。
“模型是可以轻易替换的商品,”加州大学伯克利分校人工智能研究员 Ritwik Gupta 表示,并指出阿里巴巴的通义千问 Qwen3 等竞争对手更高效地采用了 DeepSeek 的核心推理算法。Gupta 补充称,华为在昇腾芯片的训练上正经历“成长的阵痛”,但预计会逐步适应。DeepSeek 和华为对此均未置评。
来源:金融时报
via LoopDNS资讯播报 - Telegram Channel