金融时报报道，杭州深度探索公司 DeepSeek 在使用华为芯片训练新模型 R2 失败后，已推迟该模型的发布

金融时报报道，杭州深度探索公司 DeepSeek 在使用华为芯片训练新模型 R2 失败后，已推迟该模型的发布。DeepSeek 在今年 1 月释出了引发广泛关注的 R1 模型，之后它开始了 R2 模型的训练，在有关部门的鼓励下它使用了华为昇腾(Ascend)处理器而不是更成熟也更先进的英伟达 AI 芯片。但在使用昇腾芯片训练 R2 模型的过程中 DeepSeek 持续遭遇技术问题，因此转而使用英伟达芯片训练，使用华为芯片推理。

(科技情报)

via 茶馆 - Telegram Channel