⚙️ 深度求索AI模型发布受阻:华为芯片训练遇难题,凸显中国技术自主挑战
中国人工智能公司深度求索(DeepSeek)因使用华为昇腾(Ascend)芯片进行新模型R2的训练遇到持续技术问题,导致其原定于5月的发布计划推迟。此前,中国当局曾鼓励深度求索在1月发布R1模型后采用华为处理器而非英伟达系统。
尽管华为派遣工程师协助,深度求索仍未能成功在昇腾芯片上完成R2模型的训练,最终转用英伟达芯片进行训练,华为芯片用于推理。此次延误凸显了中国芯片在关键任务上仍落后于美国竞争对手,对中国实现技术自给自足的努力构成挑战。业内人士指出,中国芯片在稳定性、芯片间连接速度和软件方面逊于英伟达产品。
此外,R2模型发布延迟也与数据标注耗时超预期有关。加州大学伯克利分校AI研究员Ritwik Gupta表示,华为在使用昇腾进行训练时正经历“成长的烦恼”,但预计其最终会适应。此事件也发生在英伟达同意向美国政府分享其在华H20芯片销售收入以恢复对华销售的背景下。
(FT)
via 茶馆 - Telegram Channel
中国人工智能公司深度求索(DeepSeek)因使用华为昇腾(Ascend)芯片进行新模型R2的训练遇到持续技术问题,导致其原定于5月的发布计划推迟。此前,中国当局曾鼓励深度求索在1月发布R1模型后采用华为处理器而非英伟达系统。
尽管华为派遣工程师协助,深度求索仍未能成功在昇腾芯片上完成R2模型的训练,最终转用英伟达芯片进行训练,华为芯片用于推理。此次延误凸显了中国芯片在关键任务上仍落后于美国竞争对手,对中国实现技术自给自足的努力构成挑战。业内人士指出,中国芯片在稳定性、芯片间连接速度和软件方面逊于英伟达产品。
此外,R2模型发布延迟也与数据标注耗时超预期有关。加州大学伯克利分校AI研究员Ritwik Gupta表示,华为在使用昇腾进行训练时正经历“成长的烦恼”,但预计其最终会适应。此事件也发生在英伟达同意向美国政府分享其在华H20芯片销售收入以恢复对华销售的背景下。
(FT)
via 茶馆 - Telegram Channel