深度求索新模型发布因华为芯片问题而推迟据三位知情人士透露，DeepSeek在今年1月发布其R1模型后，被当局鼓励采用华为的昇腾处理器而非英伟达的系统

深度求索新模型发布因华为芯片问题而推迟

据三位知情人士透露，DeepSeek在今年1月发布其R1模型后，被当局鼓励采用华为的昇腾处理器而非英伟达的系统。但上述人士表示，这家中国初创公司在使用昇腾芯片进行其R2训练的过程中持续遇到技术问题，促使该公司改用英伟达芯片进行训练，同时使用华为的芯片进行推理。这些问题是该模型发布从五月推迟的主要原因，导致其落后于竞争对手。两位知情人士称，华为派遣了一支工程师团队到 DeepSeek 办公室，以帮助该公司使用其AI芯片开发R2模型。然而，尽管团队在现场， DeepSeek 未能在昇腾芯片上成功完成训练运行。该公司仍在与华为合作使该模型与昇腾芯片兼容用于推理。

—— 英国金融时报

via 风向旗参考快讯 - Telegram Channel