华为DeepSeek系列模型正式上线昇腾社区据DeepSeek介绍，DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲

华为DeepSeek系列模型正式上线昇腾社区

据DeepSeek介绍，DeepSeek-V3多项评测成绩超越了Qwen2.5-72B和Llama-3.1-405B 等其他开源模型，并在性能上和世界顶尖的闭源模型GPT-4o以及Claude-3.5-Sonnet不分伯仲。以下以Deepseek-V3为例，演示在昇腾社区如何高效获取模型及使用：一、硬件要求部署DeepSeek-V3模型需配置4台Atlas 800I A2（8*64G）服务器资源二、模型调用实践1、权重转换GPU：NPU：2、加载镜像在昇腾社区/开发资源下载适配DeepSeek-V3的镜像包：mindie:1.0.T71-800I-A2-py311-ubuntu22.04-arm64完成之后，请使用docker images命令确认查找具体镜像名称与标签。3、容器启动提供的MindIE镜像预置了DeepSeek-V3模型推理脚本，从您信任的来源自行获取权重后，放置在从上述下载的模型代码的主目录下，修改模型文件夹属组为1001，执行权限为750，启动容器。4、服务化测试配置服务化环境变量，expandable_segments-使能内存池扩展段功能，即虚拟内存特性。修改服务化参数拉起服务化出现“Daemon start success!”，则认为服务成功启动。 ...

PC版：https://www.cnbeta.com.tw/articles/soft/1476260.htm
手机版：https://m.cnbeta.com.tw/view/1476260.htm

cnBeta.COM
华为DeepSeek系列模型正式上线昇腾社区 - Huawei 华为 - cnBeta.COM

今日，华为宣布，DeepSeek-R1、DeepSeek-V3、DeepSeek-V2、Janus-Pro正式上线昇腾社区，支持一键获取DeepSeek系列模型，支持昇腾硬件平台上开箱即用。据了解，DeepSeek-V3首个版本于2024年上线并同步开源，为自研MoE模型，671B参数，激活37B，在14.8Ttoken上进行了预训练。

via cnBeta.COM中文业界资讯站 - Telegram Channel