深度求索新模型发布因华为芯片问题而推迟
据三位知情人士透露,DeepSeek在今年1月发布其R1模型后,被当局鼓励采用华为的昇腾处理器而非英伟达的系统。但上述人士表示,这家中国初创公司在使用昇腾芯片进行其R2训练的过程中持续遇到技术问题,促使该公司改用英伟达芯片进行训练,同时使用华为的芯片进行推理。这些问题是该模型发布从五月推迟的主要原因,导致其落后于竞争对手。两位知情人士称,华为派遣了一支工程师团队到 DeepSeek 办公室,以帮助该公司使用其AI芯片开发R2模型。然而,尽管团队在现场, DeepSeek 未能在昇腾芯片上成功完成训练运行。该公司仍在与华为合作使该模型与昇腾芯片兼容用于推理。
—— 英国金融时报
via 风向旗参考快讯 - Telegram Channel
据三位知情人士透露,DeepSeek在今年1月发布其R1模型后,被当局鼓励采用华为的昇腾处理器而非英伟达的系统。但上述人士表示,这家中国初创公司在使用昇腾芯片进行其R2训练的过程中持续遇到技术问题,促使该公司改用英伟达芯片进行训练,同时使用华为的芯片进行推理。这些问题是该模型发布从五月推迟的主要原因,导致其落后于竞争对手。两位知情人士称,华为派遣了一支工程师团队到 DeepSeek 办公室,以帮助该公司使用其AI芯片开发R2模型。然而,尽管团队在现场, DeepSeek 未能在昇腾芯片上成功完成训练运行。该公司仍在与华为合作使该模型与昇腾芯片兼容用于推理。
—— 英国金融时报
via 风向旗参考快讯 - Telegram Channel